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La presente invention est relative a un nouveau gene de l'acetyl- 
cholinesterase responsable de la resistance aux insecticides, notamment chez les 
moustiques, aux produits de ce gene (ADNc, prot6ine) et a leurs applications, notam- 
ment pour le criblage de nouveaux insecticides et la detection g6netique de la resis- 
5 tance aux organophosphores et aux carbamates dans les populations de moustiques. 

^acetylcholinesterase (AChE, E.C. 3.1.1.7) est une enzyme essen- 
tielle qui hydrolyse l'acetylcholine dans les synapses, mettant ainsi fin aux transmis- 
sions cholinergiques au niveau des jonctions neuronales ou neuromusculaires. L'inhi- 
bition de lAChE empeche la deactivation du signal synaptique, conduisant ainsi a 
10 une perte de controle de la transmission cholinergique. La biologie de Pacetyl- 
cholinesterase a ete tres etudiee chez les invertebres, et en particulier les insectes, car 
cette enzyme est la cible des principals classes de pesticides utilises, les organo- 
phosphores et les carbamates. Cependant, l'utilisation massive de pesticides au cours 
des demieres decennies a provoque Emergence d'especes resistantes. Parmi les meca- 
15 nismes de resistance, la selection de mutations rendant 1'ACfaE insensible aux 
insecticides a ete observee dans de nombreux cas (Pour une revue, voir Fournier et al., 
Comp. Biochem. Physiol., 1994, 108, 19-31). 

Afin de determiner avec precision, la nature de TAChE cible des 
insecticides, ainsi que les mutations responsables de la resistance a ces derniers, les 
genes codant pour des AChE (genes ace) ont 6te isoles chez differentes especes 
d'arthropodes (insectes et arachnides). 

Le premier gene ace a ete identifie chez la drosophile (Drosophila 
melanogaster), par genetique inverse (Hall et al., EMBO J., 1986, 5, 2949-2954). La 
preuve que ce gene etait implique dans la resistance aux insecticides a ete foumie par 
la mise en evidence de substitutions d'acides amines dans lAChE de drosophiles resis- 
tantes, conferant 1'insensibilite aux insecticides cholinergiques (Mutero et al., 
P.N.A.S., 1994, 91, 5922-5926). Les etudes chez D. melanogaster semblaient done' 
indiquer la presence d'un seul gene ace chez les insectes, codant pour lAChE cible des 
insecticides cholinergiques. 

Toutefois, a l'exception du gene ace d'un autre insecte, Musca 
domestica (Williamson et al., 1992, In Multidisciplinary approaches to cholinesterase 
Junctions, Eds Schafferman A. & Velan B., Plenum Press, New-York, pp 83-86 ; 
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Walsh et al., Biochem. J., 2001, 359, 175-181 ; Kozaici et al., Insect. Biochem. Mol. 
Biol., 2001, 31, 991-997), l'etude des genes ace isoles chez d'autres insectes ou bien 
chez des arachnides, par homologie avec celui de la drosophile, indiquent qu'ils ne 
sont pas impliques dans la resistance aux insecticides. 
5 En effet, aucune mutation dans la sequence en acides amines de 

PAChE ™A£o par 1p gp.ne nr* H 1 Aphis gossypii^&z Jbleplioletiix. cincticeps- et_de 

Boophihts microplus n'est observee entre les individus r6sistants et sensibles (Menozzi 
et ah, These de Doctorat de l'universite Paul sabatier, Toulouse, 2000 ;Tomita et al., 
Insect Biochem. Mol. Biol, 200, 30, 325-333; Baxter et al., Insect Biochem. Mol. 

10 Biol;, 1998, 28, 581-589; Hernandez et al., J; Med. Entomol., 1999, 36, 764-770), et 
une segregation independante est observee entre le gene ace de Citlex pipiens et C. 
tritaeniorynchus et la resistance aux insecticides (Malcolm et al., Insect. Mol. Biol., 
1998, 7, 107-120; Mori et al., Insect Mol. Biol., 2001, 10, 197-203). 

En ce qui conceme les autres genes ace isoles chez d'autres insectes, 

15 leur role dans la resistance aux insecticides n'a pas ete etudte (Lucilia cuprina : Chen 
et al., Insect. Biochem. Mol. Biol., 2001, 31, 805-816 ; Schizaphis graminam : Gao et 
al., Insect Biochem. Mol. Biol., 2001, 31, 1095-1104) ou aucune forme d'AChE 
insensible aux insecticides n'a ete decrite (Aedes aegypti, Anopheles gambiae et 
Anopheles stephensi : Anthony et ah, FEBS letters, 1995, 368, 461-465 ; Malcolm et 

20 al., In Molecular Insect Science, Eds Hageborn et al., Plenum Press, New-York, pp 57- 
65). 

Deux hypotheses ont et6 6mises pour expliquer la difference dans la 
resistance aux insecticides, observee entre Drosophila melanogaster ou Musca 
domestica et les autres insectes ou les arachnides qui ont ete etudies : la presence d'un 

25 "gene modificateur" responsable de modifications post-transcriptionnelles ou post- 
traductionnelles de TAChE, conduisant a des formes dAChE possedant des activites 
catalytiques differentes, et la presence d'un deuxieme gene ace. 

Toutefois, aucune etude n f a permis de verifier ces hypotheses et par 
consequent de determiner la nature du gene et celle de la cible (AChE) impliques dans 

30 la resistance aux insecticides chez les insectes autres que Drosophila melanogaster et 
Musca domestica ou bien chez les arachnides: 
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- La mise en evidence, chez C. pipiens, de deux formes d'AChE 
possedant des activites catalytiques distinctes supporte les deux hypotheses et 
l'analyse biochimique de ces AChE n'a pas permis de determiner la nature de lAChE 
impliquee dans la resistance aux insecticides (Bourguet et al., J. Neurochemistry, 

5 1996,67,2115-2123). 

- Un deuxieme gene ace a ete isoI6 chez les arachnides, toutefois ce 
gene n'est pas implique dans la resistance aux insecticides (Hernandez et al., Baxter et 
al., precites). 

- Un deuxieme gene ace n'a pu etre isole chez les insectes malgre de 
10 nombreuses tentatives dans differentes especes (Menozzi et al., Tomita et al., Mori et 

al., precites ; Severson et al., J. Hered., 1997, 88, 520-524). 

II ressort de ce qui precede que la nature du gene et de la cible 
(AChE) impliques dans la distance aux organophosphorous et aux carbamates n'ont 
pas ete identifies chez la plupart des insectes et chez les arachnides, notamment chez 
ceux ou ils ont ete recherches ; on peut citer les plus importants dans les domaines de 
la sante humaine ou animale et de 1'agriculture comme les vecteurs de patbogenes et 
les nuisibles, notamment de nombreux moustiques comme Culex pipiens, Aedes 
aegypti, Anopheles gambiae, Anopheles albimanus. Anopheles stephensi, et des rava- 
geurs des cultures comme Aphis gossypii, Nephotettix cincticeps et Leptinotarsa 
20 decemlineata. 

Les Inventeurs ont ident'ifie un nouveau locus du gene ace dans le 
genome d'Anopheles gambiae et de 15 especes differentes de moustiques et ils ont 
montre que ce nouveau locus, non-homologue au locus preoedemment d6crit chez D. 
melanogaster, etait implique dans la distance aux insecticides chez les moustiques. 

Ce nouveau gene represente un outil de diagnostic pour la detection 
g6netique de la resistance aux insecticides (organophosphores, carbamates) dans les 
populations de moustiques. L'AChE codee par ce gene represente une cible pour le 
criblage de nouvelles molecules actives sur les populations de moustiques resistant* 
aux insecticides actuellement utilises. 

La presente invention a, en consequence, pour objet une proline, 
caracterisee en ce qu'elle comprend une region catalytique centrale qui presente une' 
sequence en acides amin6s selectionnee dans le groupe constitue par la sequence SEQ 
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ID NO: 1 ct les sequences presentant au moins 60 % d'identite ou 70 % de similarite 
avec la sequence SEQ ID NO: 1, a l'exclusion de la sequence NCBI AAK0973 corres- 
pondant a l'acetylcholinesterase de Schizaphis graminum. 

La proteine selon l'invention represente une nouvelle acetyl- 

5 cholinesterase d'insecte, d6nommee ci-apres AchEl, responsable de la resistance aux 

organophosphores .et-aux-rarbamatfts, au moins..che2-les.inoustiques^tammenLchez_ 

C. pipiens ; le locus codant pour ladite AchEl est denommde ci-aprfcs ace-1 ; ace-2 
represente le second locus ace, qui n'est pas implique dans la r6sistance aux insectici- 
des chez les moustiques. L'unique gene ace present dans Drosophila melanogasler, 

10 qui est homologue a ace-2, est done egalement denomm6 ace-2. 

Conform6ment a l'invention, ladite region catalytique centrale 
contient le domaine catalytique de 1'AChE et correspond a celle situee entre les posi- 
tions 70 et 593 de la sequence de I'AChEl SAjiopheles gambiae (SEQ ID NO: 3, 643 
acides amines) ; elle correspond a celle situde respectiveraent entre les positions 100 et 

15 629 de la sequence d'AChEl de Schizaphis graminum (NCBI AAK0973), 60 et 582 de 
la sequence de I'AChEl de Culex pipiens (SEQ ID NO: 7), 34 et 593 de la s6quence 
d'ACh£2 $ Anopheles gambiae (figure 1, SEQ ID NO: 53), et 41 et 601 de la sequence 
d'AChE2 de Drosophila melanogaster (NCBI AAF54915). Cette region centrale qui 
contient le domaine catalytique est conservee chez les vertebres et les invertebres alors 

20 que les extremites N- et C-terminales presentent une forte variabilit6 entre les diffe- 
rentes especes. 

Conformement a l'invention, l'identite d'une sequence par rapport a 
une sequence de reference (SEQ ID NO: 1) s'apprdcie en fonction du pourcentage de 
residus d'acides amines qui sont identiques, lorsque les sequences correspondant a la 

25 region catalytique telle que definie ci-dessus sont alignees, de maniere h obtenir le 
maximum de correspondence entre elles. 

Une proteine ayant une sequence en acides amines ayant au moins 
X % d'identite avec la sequence de reference SEQ ID NO: 1 est definie, dans la 
pr6sente invention comme une protdine dont la sequence correspondant a la region 

30 catalytique centrale telle que definie ci-dessus peut inclure jusqu'a 100-X alterations 
pour 100 acides amines de la sequence SEQ ID NO: 1. Au sens de la presente inven- 
tion, le terme alteration inclut les deletions, les substitutions ou les insertions consecu- 



tives ou dispersees d'acides amines dans la sequence de reference. Cette definition 
s'applique, par analogie, aux molecules d'acide nucleique. 

La similarity d'une sequence par rapport a la sequence de r6ference 
SEQ ID NO 1 s'apprecie en fpnction du pourcentage de residus d'acides amin6s qui 
5 sont identiques ou qui different par des substitutions conservatives, lorsque les 
sequences correspondant a la r6gion catalytique centrale telle que definie ci-dessus 
sont alignees de maniere a obtenir le maximum de correspondance entre elles. Au sens 
de la pr6sente invention, on entend par substitution conservative, la substitution d'un 
acide amine par un autre qui presente des propriet6s chimiques similaires (taille, 
1 0 charge ou polarite), qui generalement ne modifie pas les propri&es fonctionnelles de la 
proteme. 

Une proteine ayant une sequence en acides aminds ayant au moins 
X % de similarite avec la sequence SEQ ID Np: 1 est deTmie, dans la presente inven- 
tion comme une proteine dont la sequence correspondant a la region catalytique 
15 centrale telle que definie ci-dessus peut inclure jusqu'a 100-X alterations non- 
conservatives pour 100 acides amines de la sequence de reference. Au sens de la 
presente invention, le terme alterations non-conservatives inclut les deletions, les 
substitutions non-conservatives ou les insertions consecutives ou dispersees d'acides 
amines dans la sequence SEQ ED NO: 1. 

La comparaison de l'AChEl selon l'invention avec les AChE 
d'insecte disponibles sur les bases de donh6es, par alignement des sequences corres- 
pondant a la region centrale telle que ddfinie ci-dessus, a l'aide du logiciel BLAST 
(http://www.ncbi.nlm.nih.gov/gorf/bl2.html. parametres par ddfaut, filtre inactiv6) 
montre que : 

25 ~ le s sequences d'AChEl et d'AChE2 d'insecte pr6sentent 36-39% 

d'identit6 (53-57% similarite) entre elles. 

- les sequences d'AChEl d'insecte presentent 65-97% d'identite (79- 
98% similarite) entre elles, 

- les sequences d'AChE2 d'insecte presentent 58-99% d'identite (73- 
30 99% similarite) entre elles, 

En outre, I'analyse phylog6n<Stique des AChE des differentes especes 
animales montre que les s6quences proteiques d'AChEl forment un groupe autonome 
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significatif (bootstrap 795/1000), et que les AChEl d'insecte forment un sous-groupe 
distinct significatif (bootstrap 856/1000). 

L 1 AChEl selon ^invention comprend des motifs caracteristiques des 
AChE (figure 1) situes aux positions suivantes, respectivement dans la sequence SEQ 

5 ID NO: 3 et dans la sequence de reference de Torpedo marmorata (SWISSPROT 

EQ29.62),: up motiLcanoniqiie Hn type FGESAG autour He 1a_s6 rineL^n-posiiionJ266- 

{200), qui est caracteristique du site actif des AchE, un site de liaison a la choline 
(residu Tryptophane en position 151 (84)) y trois residus de la triade catalytique (resi- 
dus serine, acide glutamique et histidine, respectivement en positions 266 (200), 392 

10 (327) et 506 (440)\ six r6sidus cyst6ine potentiellement impliques dans des ponts 
disulfides consents (C\iA{67)-Cm{94)\ Ci2Q{254)-C-m{265)\ C468(</02rC 5 89(*2/))> des residus 
aromatiques bordant la gorge du site actif (10 residus) et un residu phenylalanine en 
position 355 (290) mais pas en position 353 (?88), qui distingue les AChE d'inverte- 
bres de celles de vert6bres. Elle possede 6galement un peptide C-terminal hydrophobe 

15 correspondant k un signal d'addition d r un glycolipide, indiquant Ie clivage post- 
traductionnel d'un fragment C-terminal et Taddition d ? une residu d'ancrage glycolipi- 
dique comme chez Drosophila ; le residu cyst6ine dans la sequence C-terminale 
precedant le site potentiel de clivage du peptide hydrophobe pourrait etre implique 
dans une liaison disulfure intermoleculaire, liant les deux sous-unit6s catalytiques du 

20 dimere d'AChE. 

UAChEl selon Tinvention se distingue de TAChE de Drosophila 
(AChE2) par Tabsence d'une insertion hydrophile de 3 1 acides amin6s entre les residus 
situds aux positions 174 et 175 de la sequence SEQ ID NO: 3 (figure 1) ; cette inser- 
tion hydrophile pourrait etre caracteristique de l f AChE2 s au moins chez les dipteres. 
25 L'invention englobe les AChEl d ! insecte sensibles ou resistantes aux 

organophosphores et aux carbamates. 

Au sens de la presente invention on entend par ,! AChE sensible", une 
AChE dont Tactivite acetylcholinesterase est inhibee en presence d ! organophosphores 
ou de carbamates. 

30 Au sens de la presente invention on entend par "AChE r6sistante", 

une AChE dont Tactivite n'est pas inhibee par des concentrations en organophosphores 
ou en carbamates qui inhibent 100 % de Tactivite de TAChE sensible" correspondante 



issue d'un individu de la meme espece ; cette "AChE resistante" differe de la pr6c6- 
dente par la presence d'une ou plusieurs mutations dans sa sequence en acides amines 
(substitutions d'acides amines) qui modifient sa sensibilite aux inhibiteurs de 1'acetyl- 
cholinesterase ; parmi ces mutations on peut citer les suivantes F78S, I129V, G227A, 
5 F288Y, les acides amines etant num6rot6s en reference k. la sequence de TAChE de 
Torpedo marmorata (SWISSPROT P07962). 

L'activite acetylcholinesterase et les parametres catalytiques des 
AChE sont mesures par les techniques enzymatique classiques telles que celles decri- 
tes dans Bourguet et al., pr6cit6. 

10 Les proteines selon l'invention incluent toute proline naturelle, 

synthetique, semi-synth&ique ou recombinante de n'importe quel organisme proca- 
ryote ou eucaryote, comprenant ou consistant en une sequence d'acides amines d'une 
proline AChEl telle que dSfinie ci-dessus. Biles incluent notamment les proteines 
naturelles isolees chez n'importe qu'elle espSce d'insecte, ainsi que les proteines 

1 5 recombinantes produites dans un systeme d r expression approprie. 

Selon un mode de realisation avantageux de ladite AChEl, elle 
correspond k celle d'un insecte qui appartient k l'ordre des dipteres (Diptera) ; de 
maniere prSfSree, ledit insecte est choisi dans la farnille des Culicidae, parmi les 
genres Culex, Aedes et Anopheles. 

20 Selon une disposition avantageuse de ce mode de realisation, ladite 

AChEl est constitute par les sequences SEQ ID NO: 3, SEQ ID NO: 5 et SEQ ID NO: 
7, correspondant a la sequence complete de 1* AChEl de respectivement deux souches 
<X Anopheles gambiae et une souche de Culex pipiens. sensibles aux organophosphor6s 
et aux carbamates. 

25 Selon une autre disposition avantageuse de ce mode de realisation, 

ladite region centrale catalytique de r AChEl comprend une sequence s61ectionn6e 
dans le groupe constitue par les sequences SEQ ID NO: 8 a 21 representant un 
fragment d'environ 91 acides amines (fragment K, figure 1), correspondant a celui 
situe entre les positions 445 et 535 de la s6quence SEQ ID NO: 3. 

30 La presente invention a Sgalement pour objet un peptide, caractt§ris6 

en ce qu'il est constitu6 par un fragment d'au moins 7 acides amines de la prot6ine 
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AChEl, telle que definie ci-dessus ; ces fragments sont particulierement utiles pour la 
production d'anticorps reconnaissant specifiquement la proteine AChEl. 

La presente invention a egalement pour objet des anticorps, caracte- 
rises en ce qu'ils sont diriges contre la proteine AChEl ou un fragment de celle-ci, tels 
5 que definis ci-dessus. 
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Gon&m^ment^lWentronrrescfits anticorps sont soft des anticorps 

monoclonaux, soit des anticorps polyclonaux. 

Ces anticorps peuvent etre obtenus par Ies methodes classiques, 
connues en elles-m6mes, comprenant notamment rimmunisation d'un animal avec 
10 une proteine ou un peptide conforme a l'invention, afin de lui faire produire des 
anticorps diriges contre ladite proteine ou ledit peptide. 

La presente invention a egalement pour objet une molecule d'acide 
nucleique isolee, caracterisee en ce qu'elle presente une sequence selectionnee dans le 
groupe constitue par : 

- Ies sequences codant pour une proteine AChEl telle que definie ci- 
dessus (ADNc et fragment dADN genomique correspondants au gene ace- J), et 

- Ies sequences complementaires des precddentes, sens ou anti-sens. 

- Ies fragments d'au moins 8 pb, de preference de 15 pb a 500 pb des 
sequences prececientes. 

L'invention englobe, les sequences des alleles du gene ace-1 issues 
de n'importe quel insecte, ainsi que les sequences des mutants naturels (alleles sensi- 
bles et resistants; ou artificiels du gene ace-1 codant pour une proteine AChEl sensi- 
ble ou r6sistante, telle que definie ci-dessus. 

Selon un mode de realisation avantageux de l'invention, ladite 
sequence codant pour une prot6ine AChEl est selectionnee dans le groupe constitue 
par : 

a) les sequences SEQ ID NO: 2, SEQ ID NO: 4 et SEQ ID NO: 6 qui 
correspondent a 1'ADNc de la proteine AChEl de sequence en acides amines, respecti- 
vement SEQ ID NO: 3, SEQ ID NO: 5 et SEQ ID NO: 7, telles que definie ci-dessus, 
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b) les sequences SEQ ID NO: 22 et SEQ ID NO: 23 qui correspon- 
dent au gene ace-1 $ Anopheles gambiae codant les AChEl en a), lequel gene presente 
une organisation exon-intron comprenant au moins 7 exons (Tableau I)- 

Tableau I : Organisation Intron-Exon du gene ace-1 





Site 5' 


Site 3' 




Position 


Sequence 


Position 


Sequence 


Intron 1 


nd 


nd 


1179 


ttcag/ACGCA 


Intron 2 


1315 


CTCGG/gtaag 


1400 


ggcag/ACGCG 


Intron 3 


1938 1 


CTACG/gtagg 


2017 


gtcag/CTGGG 


Intron 4 


2214 


CTAAG/gtacg 


2301 


tccag/AGCAC 


Intron 5 


3009 


ACCGG/gtaag 


3075 


tacag/CAATC 


Intron 6 


3248 


TACCT/gtaag 


3355 


aacag/CGAAC 
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Selon un autre mode de realisation avantageux de l'invention, ledit 
fragment est selectionne dans le groupe constitud par les amorces de sequence SEQ ID 
NO: 39 k 50 et les fragments de sequences SEQ ID NO: 24 k 38. 

Les molecules d'acide nucleique selon l'invention sont obtenues par 

10 les methodes classiques, connues en elles-memes, en suivant les protocoles standards 
tels que ceux d6crits dans Current Protocols in Molecular Biology (Frederick M 
AUSUBEL,2000, Wiley and son Inc, Library of Congress, USA). Par exemple, elles 
peuvent etre obtenues par amplification d'une sequence nucl&que par PCR ou RT- 
PCR, par criblage de banques d'ADN genomique par hybridation avec une sonde 

1 5 homologue, ou bien par synthese chimique totale ou partielle. 

Les molecules d'acides nucleiques telles que d6finies ci-dessus peu- 
vent etre utilisees comme sondes ou comme amorces pour isoler le gene ace-1 d'autres 
especes ou des alleles de ce gene, notamment par criblage d'une banque d'ADN geno- 
mique ou d'ADNc, ainsi que pour detecter/amplifier des molecules decide nucleique 

20 (ARNm ou ADN genomique) codant une proteine AChEl telle que definie ci-dessus. 

Ces differentes molecules d'acides nucleiques permettent de mettre 
en evidence le gene ace-1, des variants alleliques de ce gene, une alteration fonction- 
nelle de ce gene ace-1 (changement substantiel de la sensibilite aux insecticides) 
resultant d'une mutation (insertion, deletion ou substitution) d r un ou plusieurs nucleo- 

25 tides au niveau dudit gene. 



10 t 1 

La presente invention a egalement pour objet une methode de 
detection d'insectes porteurs d'une resistance aux insecticides de la classe des organo- 
phosphores et des carbamates. caracteris6e en ce qu'elle comprend : 

- la preparation d'un echantillon d'acides nucleiques a partir d'insec- 

5 tes a tester, et 
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6cbantillon d'acides nucleiques, d'une mutation dans le gene ace-1 tel que d6fini ci- 
dessus. 

Ladite detection est realisee par les techniques classiques qui sont 
connues en elles memes, par exemple : (i) par amplification d'une region dudit gene 
ace-1 susceptible de contenir une mutation, puis detection de ladite mutation par 
sequencage ou par digestion par une enzyme de restriction appropriee, du produit de 
PCR obtenu, ou bien (ii) par hybridation avec une sonde marquee specifxque d'une 
region dudit gene ace-1 susceptible de contenir une mutation, puis detection directe 
des m&appariements et/ou digestion par une enzyme de restriction appropriee. 

De preference un fragment d'environ 320 pb (fragment K) est ampli- 
fy a l'aide des amorces SEQ ID NO: 39 et SEQ ID NO: 40. Par exemple, chez les 
moustiques on obtient un fragment de sequence SEQ ID NO: 24 a 38 qui presente des 
mutations entre les moustiques sensibles et resistants aux insecticides. Par exemple, 
chez C. pipiens on observe 3 substitutions dans la sequence des individus resistants 
dont 1'une introduit un site EcoRI. L'analyse du profil de restriction apres amplification 
PCR du fragment K et digestion des produits obtenus par EcoRI (analyse RFLP), 
permet de detecter rapidement le genotype ace-1 dans une population de C.pipiens ; la 
presence d'un seul fragment correspond aux homozygotes resistants (RR), la presence 
de 2 fragments d'environ 106 pb et 214 pb correspond aux individus homozygotes 
sensibles (SS) et la presence de 3 fragments de 106 pb, 214 pb et 320 pb correspond 
aux individus heterozygotes resistants (RS). 

La presente invention a egalement pour objet un reactif de detection 
d'insectes porteurs d'une resistance aux organophosphorous et aux carbamates, caracte- 
rise en ce qu'il est selectionne dans le groupe constitue par : les molecules d'acide 
nucleique et leurs fragments tels que definis ci-dessus (sondes , amorces) et les 
anticorps tels que definis ci-dessus. 



• 



La prSsente invention a egalement pour objet un vecteur recombi- 
nant, caract6rise en ce qu'il comprend un insert selection^ dans le groupe constitue 
par les molecules d'acides nucleiques codant une proteine AChEl et leurs fragments 
tels que definis ci-dessus, 
5 De preference, ledit vecteur recombinant est un vecteur d'expression 

dans lequel ladite molecule d'acide nucteique ou Tun de ses fragments sont plac6s sous 
le controle d'elements regulateurs de la transcription et de la traduction appropries. 

Ces vecteurs sont construits et introduits dans des cellules hotes par 
les m<§thodes classiques d ! ADN recombinant et de g6nie g&ietique, qui sont connues 

10 en elles-memes. De nombreux vecteurs dans lesquels on peut inserer une molecule 
d'acide nucleique d'interet afin de Tintroduire et de la maintenir dans une cellule hote 
eucaryote ou procaryote, sont connus en eux-memes ; le choix d'un vecteur approprte 
depend de Tutilisation envisagee pour ce yecteur (par exemple replication de la 
sequence d'interet, expression de cette sequence, maintien de la sequence sous forme 

15 extrachromosomique ou bien integration dans le materiel chromosomique de Thdte), 
ainsi que de la nature de la cellule hote. Par exemple, on peut utiliser des vecteurs 
viraux comme les baculovirus ou non-viraux comme des plasmides. Pour exprimer 
1'AChEl, l'ADNc $ace-l peut etre plac<§ sous le contr61e d*un promoteur constitutif . 
comme le promoteur de Tacrine 5C, dans un vecteur approprte et ledit vecteur recom- 

20 binant est introduit dans des cellules d'insecte telles que des cellules de drosophile 
(cellules de Schneider S2 ). 

La pr6sente invention a egalement pour objet des cellules procaryo- 
tes ou eucaryotes, modifi6es par un vecteur recombinant tel que defini ci-dessus ; de 
preference ces cellules sont des cellules d'insectes. 

25 Les vecteurs recombinants et les cellules modifiees telles que defi- 

nies ci-dessus, sont utiles notamment pour la production des proteines et des peptides 
AChEl selon l'invention. 

La presente invention a egalement pour objet un animal invertebre 
transgenique, caracterise en ce qu'il contient des cellules modifiees par au moins une 

30 mol6cu!e d'acide nucleique telle que definie ci-dessus ; de preference ledit animal est 
un insecte. 




12 f 

Les animaux transgeniques et les cellules modifiees telles que defi- 
nis ci-dessus, sont utiles notamment pour le criblage de substances insecticides. 

La presente invention a egalement pour objet une methode de 
criblage d'une substance insecticide, caracterisee en ce qu'elle comprend : 
5 a) la mise en contact de la substance a tester avec une proteine 
AChE4-seleetionnee-paFmi^aTjroteme^hEnsolee selon 1'inventioTi; un extrait de 
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cellules modifiees ou un echantillon biologique d'un animal transgenique contenant 
ladite proteine AChEl, tels que defmis ci-dessus, en presence ^acetylcholine ou de 
l'un de ses derives, 

b) la mesure par tout moyen appropri6, de 1'activite acetyl- 
cholinesterase du melange obtenu en a), et 

c) la selection des substances capables d'inhiber ladite activit6. 
La presente invention a egalement pour objet une methode de 

criblage d'une substance insecticide, caracterisee en ce qu'elle comprend : 

- la mise en contact d'un animal transg6nique tel que defini ci-dessus, 
avec la substance a tester, et 

- la mesure de la survie de 1'animal. 

Avantageusement, lesdites methodes de criblages mettent en ceuvre 
des AChEl resistantes aux organophosphores ou aux carbamates ou bien des cellules 
20 ou des animaux transgeniques les contenant. 

La presente invention a egalement pour objet un reactif de criblage 
de substances insecticides, caracterise en ce qu'il est selections dans le groupe cons- 
titue par les prot6ines AChEl, les vecteurs recombinants, les cellules modifiees et les 
animaux transgeniques tels que definis ci-dessus. 
25 Des substances insecticides capables d'inhiber 1'activite acetylcholinesterase des 
proteines AChEl resistantes aux insecticides de la classe des organophosphores et des 
carbamates couramment utilises ont des applications :en sant6 humaine et animale, 
pour lutter contre les vecteurs de pathogenes (par exemple Aedes aegypti, vecteur 
d'arboviroses comme la dengue et la fievre jaune, Culex pipiens vecteur du virus West- 
Nile, Anopheles gambiae vecteur africain de 1'agent du paiudisme, etc) et dans le 
domaine de l'agriculture, pour lutter contre les insectes nuisibles qui devastent les 
recoltes(par exemple le doryphore (Leptinotarsa decemlineata) qui s'attaque aux 
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pommes-de-terre, les pucerons ravageurs comme Aphis gossypii et Myzus persicae, 
etc.). 

L'invention a en outre pour objet une trousse de detection et/ou de 
criblage pour la mise en ceuvre des methodes telles que definies ci-dessus, caracterisee 
5 en ce qu'elle inclut au moins un reactif tel que defini ci-dessus. 

Outre les dispositions qui pr6c£dent, l'invention comprend encore 
d'autres dispositions qui ressortiront de la description qui va suivre, qui se refere a des 
exemples de mise en ceuvre du gene ace-1 et de ses produits (ADNc, proteine) selon la 
presente invention ainsi qu f au tableau r6sumant les sequences de la Demande et aux 
10 dessins annexes dans lesquels ; 

- la figure 1 illustre Falignement des sequences en acides amin6s des 
proteines AChEl d* Anopheles gambiae, Schizaphis graminum, An. Stephens^ Aedes 
aegypti, Drosophila melanogaster, Lucilia ,cuprina, Musca domestica et Culex 
pipiens. Par convention, les acides amines sont num6rot6s en reference a la sequence 

15 de 1'AChE du poisson torpille (Torpedo marmorata; SWISSPROT P07962). Les 
sequences N- et C- terminales ne sont pas representees en raison de leur variability 
Les acides amines conserves entre AChEl et AChE2 sont indiques en gris. Les acides 
amines sp£cifiques d'AChE2 sont indiques en noir. Les 3 r6sidus repr£sentant la triade 
catalytique (S 2 oo, E327 et H440) sont encadres. Le site de liaison a la choline (W 8 4) est 

20 soulign6. Les cercles repr6sentent la position des 14 r6sidus aromatiques bordant la 
gorge du site actif dans PAChE de Torpedo, dont 10 sont presents dans toutes les 
AChEl et ACWB2 (cercles pleins), les autres n'etant pas conserves (cercles vides). 
Trois liaisons disulfures intramoleculaires entre des r6sidus cysteines sont indiqu^es. 
La fleche horizontale indique la position du fragment K (amplifie a I'aide des amorces 

25 PdirAGSG et PrevAGSG). La region hypervariable d\AChE2 qui est absente dans 
AChEl est entouree. 

- la figure 2 illustre la detection genetique des moustiques resistants 
aux organophosphores et aux carbamates par PCR-RFLP : 

. la figure 2 A represente la comparaison de la sequence en acides 
30 amines du fragment K de differentes especes de moustiques: Cx Pip (Culex pipiens\ 
Ae alb (Aedes albopictus), Ae aeg (Aedes aegypti), An alb (Anopheles albimanus), An 
gamb (Anopheles gambiae), An fun (Anopheles funestus), An nil (Anopheles nili)> An 
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14 ! 
sac (Anopheles sacharovi), An pse (Anopheles pseadopunctipennis). Les acides ami- 
nes variants sont grises. Les sequences suivantes sont identiques: An. darlingi et An. 
albimanus; An. simdaicus, An. gambiae et An. arbiensis ; An. moucheti, An. funestus 
etAn. minimus', An. stephensi etAn. saccharovi. 

. la figure 2B illustre la comparaison des sequences nucleotidiques 
^rre^p&ndanrauIragmenlTOes soucheslensibles (S-LAB)"eT7esista"ntes (SR)! Les" 
nucleotides variants sont gris6s (t -> c en position 3 ; a -> g en position 84 : Je 
sitcEcoJU (gaattc) situe autour de cette position, utilise pour 1'analyse PCR-RFLP, est 
present uniquement dans la souche S-LAB ; c -» t en position 173). La figure 2C 
illustre les profils de restriction obtenus apres electrophorese en gel d'agarose des 
produits de digestion par EcoRI, du fragment K amplifie par PCR. La souche 
homozygote sensible S-LAB presente un profil caracterise par 2 bandes (214 pb et 
106 pb), la souche homozygote resistante presente un profil caracterise par une seul 
bande de 320 pb et les moustiques r&istants issus du croisement en retour presentent 
1 5 un profil h6terozygote caracteris6 par 3 bandes (320 pb, 2 1 4 pb et 1 06 pb). 

- la figure 3 illustre I'arbre phylogenetique des proteines AChE. 
Uanalyse phylogenetique a 6t6 r6alis6e a partir de 47 sequences de proteines AChE de 
35 especes differentes provenant de la base de donnees ESTHER 
(http://www.ensam.inra.fr/cei-bin/ace/indev) Les sequences ont ete alignees et un 
arbre a ete construit comme decrit a 1'exemple 1. Seuls les noeuds correspondant a des 
valeurs de "bootstrap" > 50% (c'est a dire des scores superieurs a 500) sont indiques. 
L'echelle repr&ente une divergence de 10 %. Agam: An. gambiae ; Aeg: Aedes 
aegypti ; Aste: Anopheles stephensi; Cpip: Culex pipiens; Dmel: Drosophila 
melanogastev. Lcup: Lucilia cxiprina: Mdom: Musca domestical Ldec: Leptinotarsa 
decemlineata; Amel: Apis mellifera: Ncin: Nephotettix cincticeps ; Sgra: Schizaphis 
graminum ; Rapp: Rhipicephalus appendicidatus ; Bmic: Boophilus microphts; Bdec: 
Boophilus decoloratus; Hsap; Homo sapiens; Btau: Bos taunts ; Feat: Felix catus ; 
Ocun: Oryctolagas cuniculus ; Rnor : Rattus norvegicus ; Mmus: Mus musculus ; 
Ggal: Gallus gallus ; Drer: Danio reno ; Eele: Electrophorus electricus ; Tamr: 
30 Torpedo marmorata ; Teal: Torpedo californica ; Bfas; Bunganis fasciatus ; Mglu: 
Myxine glutinosa ; Bflo: Branchiostoma Jloridae ; Blan: Branchiostoma lanceolatum ; 
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15 1 
Cint: Ciona intestinalis ; Csav: Ciona savignyi ; Cele: Caenorhabditis elegans ; Cbrig: 
Caenorhabditis briggsae ; Dviv: Dictyocaulus viviparus; Lopa: Loligo opalescens. 

- la figure 4 illustre le cladogramme des proteines AChEl et AChE2. 
Les sequences des prot6ines AChEl et AChE2 ont &e traitees comme & la figure L La 
5 sequence Bmic a et6 ajoutee comme sequence externe pour definir Torigine de l'arbre. 
Les cadres marques d'une ast6risque represented les prolines codees par un g6ne qui 
segrege avec la resistance aux insecticides. Les cadres vides repr6sentent les proteines 
codees par un g£ne qui ne s6gr£gue pas avec la resistance aux insecticides. L'echelle 
correspond a une divergence de 10 %. 
10 Tableau II: Liste des sequences 
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NumSro Sequence 
d'identification 



SEQ ID NO: 1 fragment de la region centrale de la proline AChEl Anopheles 

gambiae (positions 70 a 593 de la SEQ ID NO: 3). 

SEQ ID NO :2 ADNc AChE 1 Anopheles gambiae 

SEQ ID NO: 3 Proteine AChEl Anopheles gambiae 

SEQ ID NO: 4 ADNc AChEl Anopheles gambiae (souche KISUMU) 

SEQ ID NO: 5 Proteine AChEl Anopheles gambiae (souche KISUMU) 

SEQ ID NO: 6 ADNc AChEl Culex pipiens (souche S-LAB) 

SEQ ID NO: 7 Proteine AChEl Culex pipiens (souche S-LAB) 

SEQ ID NO: 8 fragment peptidique K AChEl Culex pipiens 

SEQ ID NO: 9 fragment peptidique K AChEl Aedes aegypti 

SEQ ID NO: 1 0 fragment peptidique K AChE 1 Aedes albopictus 

SEQ ID NO: 1 1 fragment peptidique K peptidique AChEl Anopheles darlingi 

SEQ ID NO: 12 fragment peptidique K AChEl An, sundaicus 

SEQ ID NO: 13 fragment peptidique K AChEl An. minimus 

SEQ ID NO: 14 fragment peptidique K AChEl An. moucheti 

SEQ ID NO: 15 fragment peptidique K AChEl An. arabiensis 

SEQ ID NO: 1 6 fragment peptidique K AChE 1 An. funestus 

SEQ ID NO: 17 fragment peptidique K AChEl An. pseudopunctipennis 

SEQ ID NO: 1 8 fragment peptidique K AChEl An. sacharovi 

SEQ ID NO: 1 9 fragment peptidique K AChEl An. stephensi 

SEQ ID NO: 20 fragment peptidique K AChEl An. albimanus 

SEQ ID NO: 2 1 fragment peptidique K AChEl An. nili 

SEQ ID NO: 22 g&ne ace-1 An. gambiae 

SEQ ID NO: 23 gene ace-1 An. gambiae KISUMU 

SEQ ID NO: 24 fragment nucleotidique K AChEl C. pipiens (souche S-LAB) 

SEQ ID NO: 25 fragment nucleotidique K AChEl C. pipiens (souche SR) 

SEQ ID NO: 26 fragment nucleotidique K AChEl Aedes aegypti 

SEQ ID NO: 27 fragment nucleotidique K AChEl Aedes albopictus 

SEQ ID NO: 28 fragment nucleotidique K AChEl Anopheles darlingi 

SEQ ID NO: 29 fragment nucleotidique K AChEl An. sundaicus 

SEQ ID NO: 30 fragment nucleotidique K AChEl An. minimus 
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SEQ ID NO: 31 
SEQ ED NO: 32 
SEQ ID NO: 33 
SEQ ID NO: 34 
SEQ ID NO: 35 
SEQ ID NO: 36 
SEQ ID NO: 37 
SEO IDNOj 3_8_ 
SEQ ED NO: 39 
SEQ ED NO: 40 
SEQ ED NO: 41 
SEQ ED NO: 42 
SEQ ED NO: 43 
SEQ ED NO: 44 
SEQ ED NO: 45 
SEQ ED NO: 46 
SEQ ED NO: 47 
SEQ ID NO: 48 
SEQ ED NO: 49 
SEQ ED NO: 50 
SEQ ED NO: 51 
SEQ ID NO: 52 
SEQ ED NO: 53 



fragment nucleotidique K AChEl An. 
fragment nucleotidique K AChEl An. 
fragment nucleotidique K AChEl An. 
fragment nucleotidique K AChEl An. 
fragment nucleotidique K AChEl An. 
fragment nuc!6otidique K AChEl An. 
fragment nucleotidique K AChEl An. 

^agmentjiucleotidique-K-^AGhE-l^/r 
amorce PkdirAGSG 
amorce PlcrevAGSG 
amorce PbdirAGSG 
amorce PbrevAGSG 
amorce culex-bdirl 
amorce culex-krevl 
amorce AG 1-Adir 
amorce AGl-Arev 
amorce AGl-Bdir 
amorce AGl-Brev 
amorce AGl-Cdir 
amorce AGl-Crev 
Proteine AChEl Ciona intestinalis 
Proteine AChEl Ciona savignyi 
Proteine AChE2 Anopheles gambiae 



moucheti 

arabiensis 

funestus 

pseudopunctipennis 
sacharovi 
stephensi 
albimanits 

irili 
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EXEMPLE 1 : Materials et methodes 
a) Souches et croisements 

Cinq souches de C. pipiens ont ete utilisees: S-LAB, une souche 
standard sensible aux insecticides (Georghiou et al., 1966, Bull. Wld. Hlth Org., 35, 
691-708), SA1, SA4 et EDIT qui possedent une seule AChE sensible aux insecticides, 
et SR qui est homozygote pour une AChE insensible aux insecticides (Berticat et al., 
Genet. Res., 2002, 79, 41-47). Les souches possedantune AChE sensible et insensible 
sont denommees respectivement S et R. 

b) Nomenclature des genes ace et nW r otation des seq uences d'acirie.s amjnjs 

ace-] represente le locus codant pour une AChE cholinergique res- 
ponsable de la resistance aux organophosphorous et aux carbamates chez C. pipiens 
(AChEl), precedemment denomme^ce.7 (Raymond et al., Genetica, 2001, 112/113, 
287-296). ace-2 represente le second locus ace, qui n'est pas implique dans la resis- 
tance aux insecticides chez C. pipiens (precedemment denomme Ace.2), dont la fonc- 
tion est inconnue chez C. pipiens. L'unique gene ace present dans Drosophila 
melanogaster, qui est homologue a ace-2, est done d6nomme de meme. 




Dans les analyses qui suivent, les positions des risidus d'acides 
aminis sont indiquees en reference a la sequence de 1'AChE du poisson torpille 
[Torpedo marmorata; GENBANK P07962], selon la nomenclature recommandee par 
Massoulie et al., 1992, In Multidisciplinary approaches to cholinesterase functions, 
5 eds, Schafferman, A. & Velan, B. (Plenum Press New York), p 285-288]. 
c) Analyse de la transmission du gene ace-1 

Les femelles etant indiquees en premier, des croisements Fl (S X R) 
et des croisements en retour (Fl X S-LAB et S-LAB X Fl) ont eti obtenus par 
croisement en masse d'adultes. Quelques larves issues des croisements en retour ont 

10 iti traitees avec une dose de carbamate (propoxur, 4mg/L) qui tue 100 % des larves 
sensibles. La liaison entre ace-1 et la resistance au propoxur a ete itudiie par RFLP 
chez les larves survivantes, a partir d'un produit PCR de 320 pb permettant d'identifier 
les alleles S et R. Les experiences ont ete rialisies de facon indipendante, avec S - 
SA1, S = S A4 et S = EDIT. 

15 d\ Analyse des sequences et assemblage des genes 

Toutes les analyses de sequences ont ete effectuees a partir des 
sequences brutes ^Anopheles gambiae disponibles sur le serveur INFOBIOGEN 
(htto://www.infbbiogen.fr) et des outils disponibles sur le site 
fhttp://www.ncbi.nlm.nih. gov/blast/blast) . Les siquences genomiques codant une 

20 AChE ont ete identifi6es a l'aide des logiciels TBLASTN et BLAST (Altschul et al., J . 
Biol. Mol., 1990, 215, 403-410). Les siquences genomiques identifies ont iti 
assemblies a l'aide du logiciel ABI Prism Auto-Assembler (v2.1, PERKIN ELMER). 
Les sequences ont iti verifiees et corrigees a l'aide du logiciel Ensembl Trace Server 
(http: // trace.ensembl.org/). Deux concatenations de respectivement 5195 et 6975 

25 paires de bases, codant respectivement pour AChEl et AChE2 ont ete assemblies a 
partir de respectivement 64 et 74 siquences independantes (redondance moyenne de 
10,5 et 6,5). Les exons et les sequences proteiques ont et6 identifies a l'aide d'une 
combinaison entre les logiciels FGENESH (http://www.sanger.uk) et BLASTX 
fhttp://www.ncbi.nlm.nih.gov') . Les siquences genomiques d'AChE d'ascidies ont ete 

30 assemblies a partir de siquences brutes deposies dans les bases de donnies du NCBI 
(Ciona savignyi) et du Doe Joint Institute (Ciona intestinalis, 
http://www.i gi.doe.gov/programs/ciona/ciona mainage-html) . Les recherches dans les 
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bases de donnees de Drosophila ont ete effectives a l'aide de Flybase 

(http://www.fruitflv.ora/') . 

e) Comoaraisons de sequences 

Les sequences • des proteines AChEl et AChE2 6' Anopheles 
5 gambiae deduites des sequences gfcnomiques et les sequences peptidiques deduites de 

fragm£nts_ECR-de-Cr-pjpje«5 et-/4r-aegpprf-onrete~ahgneer ave'iTcelles des AChE 

connues, a l'aide du logiciel ClustalW, en utilisant une matrice BLOSUM et des 
parametres par defaut (Thompson et al., N.A.R., 1994, 22, 4673-4680). 

Un arbre phylogenetique a 6t6 construit en utilisant ralgorithme du 
10 plus proche voisin (neighbour-joining algorithm) de la version DDBJ de Clustal W 
( http://hvpernig.nig.ac.ip/homologv/ex clustalw-e.shtmD . L'analyse de type 
Bootstrap (1000 comptages et 111 valeurs d'entree) a ete utilisee pour evaluer les 
degres de confiance pour la topologie de r arbre. La construction des arbres a 6t6 reali- 
see a l'aide du logiciel Treeview (vl.6.6). 
15 f) Numeros d'accession 

Les numeros des s6quences (numeros d'accession dans les bases de 
donnees ou les numeros d' identification dans la liste de sequences) ayant servi a 
l'analyse genetique sont les suivants. 

- Craniata : Homo sapiens : NP_00046 ; Bos taunts : P23795 ; Felix 
20 catus : 06763 ; Oryctolagits cuniculus : Q29499 ; Rattus norvegicus : P36136 ; Mus 

musculus : P21836 ; Galhis galltts: CAC37792; Danio reno: Q9DDE3 ; 
Electrophorus electrictis : 6730113 ; Torpedo tnarmorata: P07692 ; Torpedo 
californica : P04058 ; Bungarus fasciatus : Q92035 ; Myxine glutinosa : Q92081. 

- Cephalocordes : Branchiostoma jloridae : 076998 et 076999 ; 
25 Branchiostoma lanceolatum : Q95000 et Q95001 . 

- Urocordes : Ciona intestinalis : SEQ ID NO : 51 ; dona savignyi : 

SEQ ID NO : 52. 

- Nematodes : Caenorhabditis elegans (1 a 4) : P38433, 061371, 
061459 et 061372; Caenorhabditis briggsae (1 a 4) Q27459, 061378Q9NDG9 et 

30 Q9NDG8 ; Dictyocaulus viviparus : Q9GPLO. 

- Insectes : Anopheles gambiae (1 et 2) : SEQ ID NO:3 et SEQ ID 
NO: 53 ; Aedes aegypti (1 et 2) : SEQ ID NO: 9 et AAB3500 ; An. stephensi :P56161 ; 




Culex pipiens : SEQ ID NO: 7 {ace-1) et Esther data base pour ace-2 ; Drosophila 
melanogaster :P07140 ; Lucilia cuprina : P91954 ; Musca domestica : AAK69132.1 ; 
Leptinotarsa decemlineata : Q27677 ; Apis mellifera : AAG43568 ; Nephotettix 
cincticeps : AF145235_1 ; Schizaphis graminum : Q9BMJ1. 

5 - Arachnides : Rhipicephalus appendicular : 062563 ; Boophilus 

microplus (I et 2) : 045210 et 061864 ; Boophilus decolorants : 061987 ; 

- Mollusques : Loligo opalescens : 0971 10. 
f) rionaee du fragment K et genotypage d' ace-1 che * Culex pipiens 

L'ADN de moustique a 6te extrait comme decrit dans Rogers et al., 

10 [Plant Molecular Biology manual, 1988, eds. Gelvin, S.B.I Schilperoot, R.A. (Kluwer 
Academic Publishers, Boston), V0IA6, pi -10]. Les oligonucleotides PkdirAGSG ( 5'- 
ATMGWGTTYOAGTAC ACSGAYTGG-3 ' , SEQ ID NO: 39) et PkrevAGSG (5'- 
GGCAAARTTKGWCCAGTATCKCAT-3 SEQ ID NO: 40) amplifient un fragment 
de 320 pb (fragment K) a partir de 1'ADN genomique de plusieurs moustiques. 30 

15 cycles d' amplification PCR ont 6t6 realises dans les conditions suivantes : 94°C 
pendant 30s, 50°C pendant 30s a et 72°C pendant 30s. Les sequences ont ete determi- 
nees directement sur les produits PCR sur un sequenceur ABI prism 3 10, a l'aide du 
kit Big Dye Terminator. 

Le genotypage & ace-1 chez Culex est realis6 dans les conditions 

20 suivantes : Les fragments K obtenus comme decrit prec6demment sont digeres par 
EcoRI et le produit de digestion est separe par electrophorese sur un gel d' agarose a 
2%. Les profils de restriction montrent : 1 bande (320 pb) chez les moustiques homo- 
zygotes resistants RR, 2 bandes (106 pb et 214 pb) chez les moustiques homozygotes 
SS et 3 bandes (103 pb, 214 pb et 320 pb) chez les moustiques heterozygotes RS. 

25 ht Clonage de PADNc d 'ace-1 chez les indiv irfus sensibles et resistants 

L'ADNc du gene ace-1 de Culex pipiens a ete obtenu a partir de 
TARN extrait d'individus de la souche sensible de ref6rence S-LAB, au tout premier 
stade de developpement larvaire LI. La transcription inverse a ete realisee avec un 
oligonucleotide 18T et la SuperScriptHRNaseH (IN VITROGEN), selon les condi- 

30 tions recommand6es par le fabricant. 
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Deux fragments d'ADNc ont ete amplifies par PCR a l'aide d'oligo- 
nucleotides ddgeneres obtenus a partir de l'alignement des sequences des genes ace- 1 
$ Anopheles Gambiae et de Schizaphis graminwn : 

- un fragment b (193pb) a ete amplify a l'aide du couple d'amorces PbdirAGSG 
5 (5 * GGYGCKACMATGTGGAA YCC3 * , SEQ ID NO: 41) et PbrevAGSG 

(S^GCAMRATCACGTl^^ 

- un fragment k (320pb) a et6 amplifte a l'aide du couple d'amorces PkdirAGSG 
(5 * ATMGWGTTYGAGTACACSGAYTGG3 \ SEQ ID NO: 39) et PkrevAGSG 
(5 5 GGC AA ARTTKG WCCAGTATCKCAT3 \ SEQ ID NO: 40). 

10 Les fragments b et k ainsi obtenus ont ensuite ete clones et sequences, 

selon les techniques classiques connues en elles-memes de l'Homme du metier, telles 
que dScrites dans Current Protocols in Molecular Biology {Frederick M. AUSUBEL, 
2000, Wiley and son Inc, Library of Congress, USA). 

Un fragment d'ADNc de plus grande taille a ete amplifie par PCR, & 

15 l'aide d'amorces specifiques de Culex pipiens deduites des sequences des fragments b 
et k prec6demment obtenues. A savoir : 

- un fragment Culex A (1 127 pb) a ete amplifie par PCR a l'aide du couple d'amorces 
amorces: culex-bdirl (5 TACATCAACGTGGTCGTGCCACG3 SEQ ID NO: 43) et 
culex-krevl (5*GTCACGGTTGCTGTTCGGG3 \ SEQ ID NO: 44). Le fragment 

20 Culex A de 1 127 pb ainsi obtenu a ensuite 6te clone et sequence, comme ci-dessus. 

Les extremites des ADNc ont ete amplifiees par la technique RACE 
(Rapid Amplification ofcDNA Ends), a l'aide d ! un kit commercial (du kit Gene Racer 
(IN VITROGEN) selon les conditions indiquees dans le manuel d'utilisation. Ensuite 
elles ont 6te clonees puis sequencees, comme ci-dessus. 
25 i) Clonage du gene ace-1 chez les individus sensibles et rSsistants 

La sequence de FADN g6nomique de la souche A.Gambiae 
KISUMU (souche sensible de reference de TAfrique de TOuest) a ete obtenue a partir 
dc moustiques homozygotes. 

De maniere plus precise, l'ADN de moustique a ete extrait comme 
30 decrit dans Rogers et al, [Plant Molecular Biology manual 1988, eds. Gelvin, S.B.I 
Schilperoot, R.A. (Khiwer Academic Publishers, Boston), V0IA6, pl-10]. 3 fragments 
chevauchants (A, B et C) ont ete amplifies dans les conditions suivantes : 94°C 




pendant 30s, 50°C pendant 30s a et 72°C pendant 30s (30 cycles), a l'aide d'amorces 
synthetisees a partir de la sequence du gene ace-1. A savoir : 

- le fragment A (1 130pb) a ete amplifie a l'aide du couple d'amorces 
AGl-Adir (5'CGACGCCACCTTCACA3\ SEQ ID NO: 45) et AGl-Arev 

5 (5 ' G ATGGCCCGCTGG AAC AGAT3 ' , SEQ ID NO: 46), 

- le fragment B (1167pb) a et6 amplifie a l'aide du couple d'amorces 
AGl-Bdir (5 ' GGGTGCGGG AC AAC ATTC AC3 ' , SEQ ID NO: 47) et AGl-Brev 
(5 'CCCCGACCGACGAAGGA3 % SEQ ID NO: 48), et 

- le fragment C (876pb) a 6te amplifie a l'aide du couple d'amorces 
10 AGl-Cdir (5 'AGATGGTGGGCGACTATCAC3', SEQ ID NO: 49) et AGl-Crev 

(5*CTCGTCCGCCACCACTTGTT3\ SEQ ID NO: 50). 

Les sequences des fragments A, B et C ont ete determinees directe- 
ment sur les produits PCR, a l'aide ^oligonucleotides internes, inclus dans ces frag- 
ments, en utilisant le kit Big Dye Terminator et un sequenceur ABI prism 3 1 0. 

1 5 EXEMPLE 2 : Mise en evidence de 2 genes ace chez Anopheles gambiae 

Des genes homologues des genes ^acetylcholinesterases humaines 
et de drosophiles ont ete recherches a partir de fragments de sequences deposees dans 
les bases de donnees, en utilisant le logiciel TBLASTN. Deux groupes de fragments 
distincts codant pour une AChE tres similaire a celle de la drosophile ont ete identi- 

20 fies. Deux genes de respectivement 6975 pb {ace-1) et 5195 pb {ace-2) ont 6te 
reconstruits a partir de fragments chevauchants de chaque groupe. L'analyse des genes 
a l'aide des logiciels FGENESH et BLASTX montre que les genes ace-1 et ace-2 sont 
constitues respectivement d'au moins 7 et 8 exons codant pour des proteines d'environ 
534 et 569 acides amines, denommdes respectivement AChEl et AChE2. Toutefois, 

25 cette analyse n'a pas permis de determiner avec certitude la sequence des extremit6s 5' 
et 3' de I'ADNc et les s6quences NH2 et COOH des proteines correspondantes, qui ne 
sont pas conservees entre les differentes AChE. 

L'analyse des sequences en acides amines confirme que les proteines 
AChEl et d'AChE2 sont tres homologues a 1'AChE de Drosophila (BLASTP : P < e* 

30 l8 °) et contiennent un motif canonique FGESAG autour de la serine en position 200, 
en reference a la sequence de 1'Ache de Torpedo (S 2 oo figure 1), qui est caracteristique 
du site actif des AchE. En outre d'autres motifs caracteristiques des AChE ont egale- 
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ment ete retrouves dans les deux sequences (AChEl et AChE2): le site de liaison a la 
choline (residu Tryptophane en position 84, W84), les trois residus de la triade cataly- 
tique (residus serine, acide glutamique et histidine, respectivement en positions 200, 
327 et 440 : S 2 oo, E 327 et H440), les six r6sidus cysteine potentiellement impliqu6s dans 
des ponts disulfides conserves (C 67 -C 94 ; C 254 -C 265 ; C 402 -C 521 ), et des residus aromati- 

ques-bordarrt-la-^orge-du-sue actn [TD et lTfisIdur.Tespectivement pour AChEl et 

AChE2). 

Dans les deux sequences, on observe la presence d'un residu 
phenylalanine en position 290 (F290) raais pas en position 288 ; cette caracteristique 
commune aux AChE d'invertebres est responsable d'une plus large specificity de subs- 
trat des AChE d'invertebres, par rapport a celles de vertebras. 

L'analyse des sequences C-terminales des AChE de diptere montre 
la presence d'un peptide hydrophobe coiTespondant a un signal d'addition d'un glyco- 
side, indiquant le clivage post-traductionnel d'un fragment C-tenninal et 1'addition 
d'une residu d'ancrage glycolipidique comme chez Drosophila et d'autres especes de 
moustiques. Dans toutes les sequences on observe egalement la pr6sence d'un residu 
cystine dans la sequence C-terminale precedant le site potentiel de clivage du peptide 
hydrophobe. Ce r<§sidu cysteine pourrait 6tre implique dans une liaison disulfide 
intermoleculaire, liant les deux sous-unites catalytiques du dimere d'AChE. 

Les proteines AChEl et AChE2 d'An. gambiae presentent 53 % de 
similarity entre elles et montrent respectivement : 76 % et 55 % de similarity avec 
1'AChE de Schizaphis graminum (numero d'accession NCBI AAK09373 ou 
GENBANK 12958609), 53 % et 98 % de similarite avec 1'AChE d'An. stephensi 
(GENBANK 2494391), 54 % et 95 % de similarity avec 1'AChE d'Aedes aegypti 
(GENBANK 2133626), 52 % et 83 % de similarity avec 1'AChE de Drosophila 
(GENBANK 17136862). 

La difference majeure entre AChEl et AChE2 reside dans une inser- 
tion de 31 acides amines dans la sequence d'AChE2 (figure 1). Cette sequence, 
denommee "insertion hydrophilique" dans 1'AChE de Drosophila, est absente dans les' 
AChEs de vertebres et de nematodes et pourrait 6tre caracteristique de l'AChE2, au 
moins chez les dipteres. 




Ces resultats demontrent la presence de deux gfenes ace dans le 
genome $ Anopheles gambiae, Tun codant pour AChEl qui est apparent^ a TAChE 
de Schizaphis graminum, et I'autre pour AChE2 qui est apparentee a l l AChE de 
Drosophila et aux AChEs connues de moustiques. La presence d'autres genes ace 
5 chez An. gambiae est trfcs improbable dans la mesure ou des recherches complemen- 
taires dans les bases de donnees du genome d'An gambiae, en utilisant des parametres 
moins stringents, ont detecte uniquement des sequences codant pour des alpha-estera- 
ses (EC 3.1.1) et des carboxy I esterases (EC 3.1.1.1). 

EXEMPLE 3 : Mise en Evidence d'un unique ghne ace chez Drosophila 
10 melanogaster 

La presence d*un gene homologue du gene ace-1 a ete recherch6e 
dans le genome de Drosophila. Les recherches TBLASTN ont permis de d&ecter le 
gene ace pr6cedemment identifie, homology du gene ace-2 A 9 Anopheles gambiae 
mais n'ont pas permis de detecter d'autres sequences homologues du gene ace-1. Des 
15 recherches k Taide de parametres moins stringents ont permis de detecter uniquement 
des alpha et des carboxylest&rases. Ces resultats demontrent que le genome de la 
drosophile contient un unique gene ace (ace-2). 

EXEMPLE 4 : Mise en Evidence d'au moins deux gfenes ace chez les autres espe- 
ces de moustiques 

20 La presence du gene ace-1 dans le genome d'autres especes de 

moustiques a et<§ analysee par PCR a l'aide ^oligonucleotides degen6r6s (PdirAGSG 
et PrevAGSG, SEQ ID NO: 39 et 40) permettant d'amplifier un fragment exonique 
(fragment K, d'environ 320 pb figure 1), correspondant a des sequences conservees 
entre les sequences d* AChEl d'An. gambiae et Schizaphis graminum mais divergentes 

25 entre les sequences d* AChEl et AChE2 d'An. gambiae. 

La sequence des produits PCR obtenus. k partir de l'ADN genomique 
de differentes especes de moustiques, montre un pourcentage d'identite tres eleve 
entre les sequences d % Anopheles, Culex et Aedes. En outre, la plupart des substitutions 
sont silencieuses puisque les sequences en acides amin6s deduites de ces sequences 

30 nucl6otidiques ne different entre elles que part 5 a 6 acides amines (Figure 2A). Le 
fragment K a egalement et6 amplify par RT-PCR k partir de 1'ARNm de C. pipiens, 
indiquant que le gene ace-1 est exprime sous forme d'ARNm ; ce rdsultat est en 
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accord avec Pexistence, chez C. pipiens, de deux AChEs possedant des proprietes 
catalytiques distinctes. 

EXEMPLE 5 : Analyse de la liaison entre le gene ace-1 et la resistance aux 
insecticides 

Afin d'analyser la liaison entre le gene ace-1 et la resistance aux 
iiisectidde5^ragment^ 
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tants (souche R), a ete sequence. La comparaison des sequences du fragment K entre 
les souches S et R montre des differences au niveau de 3 nucleotides (substitutions 
silencieuses, Figure 2B). L'une de ces substitutions affecte un site EcoRI, ce qui 
10 permet de differencier facilement le locus ace-1 des souches S et R par PCR-RFLP : 
les profils de restriction montrent 1 bande (320 pb) chez les individus homozygotes 
resistants, 2 bandes (106 pb et 214 pb) chez les moustiques homozygotes SS et 3 
bandes (103 pb, 214 pb et 320 pb) chez les moustiques h6terozygotes RS (figure 2C). 

La liaison entre le gene ace-1 et la resistance au propoxur a ete etu- 
diee, en triple, de la facon suivante : des larves de croisement en retour (S x R) x S ont 
et£ traitees par une dose letale pour les individus sensibles et le genotype d 'ace-1 a 6t6 
analyse chez les survivants, par PCR-RFLP. 

Les resultats montrent que 1'exposition au propoxur tue 50 % des 
larves dans tous les croisements en retour, c'est a dire tous les individus sensibles. 
20 Toutes les larves survivantes (100 pour chaque croisement en retour, 300 au total) 
montrent un profil h6terozygote en RFLP, indiquant qu'elles possedent toutes une 
copie du gene ace-1 de la souche R. 

Ces resultats demontrent que le gene ace-l est lie" de facon tres 
etroite avec la resistance aux insecticides (moins de 1 % de recombinaison avec un 
25 degre de confiance de 0,05). 

EXEMPLE 6 : Analyse de la phylogenie des genes ace-1 et ace-2. 

Des arbres phylogenen^tiques ont et<J construits a partir des sequen- 
ces des regions conservees des AChE #An gambiae (SEQ ID NO: 1 et fragment 34- 
393 de la sequence SEQ ID NO: 53, figure 1), des fragments K de C. pipiens etAedes 
30 aegypti (SEQ ID NO: 8 et 9) et de 33 sdquences d'AChE disponibles dans 
GENBANK, a 1'aide de la methode du plus proche voisin {neighbour-joining method), 
comme decrit dans le matenels et methodes. 




La figure 3 illustre l*heterogen6ite du nombre de genes ace au cours 
de 1'evolution du regne animal. Chez les cordes, les c6phalocordes possedent au moins 
deux genes ace alors que les urocordes n'en possedent qu'un seul, comme deduit de 
['analyse de leur genome. Chez les arthropodes, les dipteres possedent, soit un seul 
5 gene ace (Drosophila du sous-ordre des brachyceres) ou deux genes ace (moustiques 
du sous-ordre des nematoceres). La topologie de I'arbre montre que ces deux genes 
ace se sont dupliqu6s tres precocement au cours de Involution, probaiblement avant la 
separation entre les protostomes et les deut6rostomes. Ces resultats sont supportes par 
le fait que les AChE de mollusques, de nematodes et d'arthropodes se ramifient a 

10 partir des sequences des cord6s (craniatia, cephalocordes et urocordes). Les resultats 
montrent que les arthropodes et les nematodes possedent une AChE apparentee. 

Ces resultats indiquent que les genes ace-1 et ace-2 identifies chez 
les insectes proviennent d'un 6venement de duplication tres ancien et que l'absence du 
gene ace-1, au moins chez certaines especes du sous-ordre des brachyceres 

15 (Drosophila ) resulte de la perte d'un gene ace plut6t que d'une duplication recente du 
gene ace chez les nematoceres. Ces resultats suggerent 6galement que les extrapola- 
tions faites a partir d'etudes chez D. melanogaster sont a considerer avec reserve dans 
la mesure ou la situation de Drosophila n'est ni representative des dipteres ni de 
l'ensemble de la classe des insectes. 

20 EXEMPLE 7 ; Determination de la sequence complete de l'ADNc d'ace-1 

L'ADNc d'ace-l a 6te clon6 k partir d'une souche d'Anopheles 
gambiae de l'Afirique de l'Ouest (souche KISUMU) et d'une souche de Culex pipiens 
(souche S-LAB) sensibles aux insecticides de la classe des organophosphor6s et des 
carbamates, comme decrit dans le materiels et methodes 

25 La sdquence complete de l'ADNc correspond respectivement aux 

sequences SEQ ID NO: 4 et SEQ ID NO: 6 et qui codent pour une proteine de 
respectivement 643 et 702 acides amines (SEQ ID NO:5 et SEQ ID NO: 7). 
EXEMPLE 8 : Determination de la sequence complete du g&ne ace-1 

La sequence complete du gene ace-1 a ete determinee a partir de 

30 l'ADN g6nomique d'une souche $ Anopheles gambiae de l'Afirique de l'Ouest (souche 
KISUMU), comme decrit dans le materiels et methodes. 
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La sequence complete du gene ace-1 correspond a la sequence SEQ 
ID NO: 23 qui presente une organisation intron-exon comprenant au moins 7 exons 
(Tableau I). 

Ainsi que cela ressort de ce qui precede, l'invention ne se limite 
nullement a ceux de ses modes de mise en ceuvre, de realisation et d'application qui 
-viennen^'g^e^t^e-fafonTJtas^pliclte ; elle en em6rasse^u^onffielwtesTe7 
variantes qui peuvent venir a 1'esprit du technicien en la matiere, sans s'ecarter du 
cadre, ni de la portee, de la presente invention. 
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REVENDICATIONS 

1°) Acetylcholinesterase d'insecte, caracterisee en ce qu'elle 
comprend une region catalytique centrale qui pr6sente une sequence en en acides 
amines selectionnee dans le groupe constitute par la sequence SEQ ID NO: 1 et les 
5 sequences presentant au moins 60 % d'identite ou 70 % de similarity avec la sequence 
SEQ ID NO: 1, a l'exclusion de Tacetylcholinesterase de sequence NCBI AAK0973. 

2°) Acetylcholinesterase selon la revendication 1, caracterisee en ce 
qu'elle correspond a celle d'un insecte de la famille des Culicidae, choisi parmi les 
genres Culex, Aedes et Anopheles. 
10 3°) Acetylcholinesterase selon la revendication 2, caracterisee en ce 

qu f elle est constituee par une sequence selectionnee dans le groupe constitue par les 
sequences SEQ ID NO: 3, SEQ ID NO: 5 et SEQ ID NO: 7. 

4°) Acetylcholinesterase selon la revendication 2, caracterisee en ce 
que ladite region catalytique centrale comprend une sequence selectionnee dans le 
15 groupe constitue par les sequences SEQ ID NO: 8 a 21 . 

5°) Peptide, caracterise en ce qu'il est constitue par un fragment d'au 
moins 7 acides amines de racetylcholinesterase selon Tune quelconque des revendica- 
tions 1 & 4. 

6°) Molecule d'acide nucieique isotee, caracterisee en ce qu'elle 
20 presente une sequence selectionnee dans le groupe constitue par : 

~ les sequences codant pour une acetylcholinesterase selon Tune 
quelconque des revendications 14 4 (ADNc et gene ace-T)\ 

- les sequences compiementaires des sequences precedentes, sens ou 

anti-sens, et 

25 - les fragments d'au moins 8 pb, de preference de 15 pb a 500 pb des 

sequences ptecedentes. 

7°) Molecule d'acide nucieique selon la revendication 6, caracterisee 
en ce qu'elle est selectionnee dans le groupe constitue par les ADNc de sequence SEQ 
ID NO: 2, SEQ ED NO:4 et SEQ ID NO: 6 et les ADN genomiques de sequence SEQ 

30 ID NO: 22 et SEQ ID NO: 23. 
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8°) Molecule d'acide nucleique selon la revendication 6, caracterisee 
en ce qu'elle est selectionnee dans le groupe constitue par les amorces de sequence 
SEQ ID NO: 39 a 50 et les fragments de sequence SEQ ID NO: 24 a 38. 

9°) Methode de detection d'insectes porteurs d'une resistance aux 
insecticides de la classe des organophosphores et des carbamates, caracterisee en ce 
-qu'el le comprend-: 



- la preparation d'un echantillon d'acides nucleiques a partir d'insec- 
tes a tester, et 

- la detection par tout moyen approprie, de la presence dans ledit 
10 echantillon d'acides nucteiques, d'une mutation dans le gene ace-1 tel que deTini a la 

revendication 6 ou a la revendication 7. 

10°) Methode selon la revendication 9, caracterisee en ce que ladite 
detection comprend : 

- l'amplification d'un fragment d'environ 320 pb a l'aide du couple 
1 5 d'amorces SEQ ID NO: 39 et 40, 

- la digestion dudit fragment a l'aide d'une enzyme de restriction 

appropriee, et 

- l'analyse du profil de restriction obtenu. 

1 1°) Methode selon la revendication 10, caracterisee en ce que ladite 
20 enzyme de restriction est EcoRI. 

12°) Vecteur recombinant, caracterise" en ce qu'il comprend un insert 
selectionne dans le groupe constitue- par les molecules d'acides nucleiques selon l'une 
quelconque des revendications 6 & 8. 

13°) Cellules, caracterisees en ce qu'elles sont modifies par un 
25 vecteur recombinant selon la revendication 12. 

14°) Anticoips, caracterises en ce qu'ils sont diriges contre 
racetylcholinesterase selon l'une quelconque des revendications 1 a 4 ou le peptide 
selon la revendication 5. 

15°) Reactif de detection d'insectes porteurs d'une resistance aux 
30 insecticides de la classe des organophosphores et des carbamates, caracterise en ce 
qu'il est selectionne dans le groupe constitue par les molecules d'acides nucleiques et 




leurs fragments selon Tune quelconque des revendications 6 a 8 et les anticorps selon 
la revendication 14. 

16°) Animal invertebre transgenique, caracteris6 en ce qu'il contient 
des cellules transformees par au moins une molecule d'acide nucleique selon la reven- 
5 dication 6 ou la revendication 1. 

17°) MSthode de criblage d'une substance insecticide, caracterisee en 

ce qu'elle comprend : 

a) la mise en contact de la substance k tester avec une acetyl- 
cholinesterase selon Tune quelconque des revendications 1 a 4, un extrait de cellules 

10 modiftees telles que definies k la revendication 13 ou un 6chantillon biologique d'un 
animal transgenique tel que defini k la revendication 16, en presence ^acetylcholine 
ou de Tun de ses derives, et 

b) la mesure par tout moyen approprie, de l'activite acetyl- 
cholinesterase du m61ange obtenu en a), et 

15 c) la selection des substances capables d'inhiber ladite activite. 

18°) Methode de criblage de substances insecticides, caracterisee en 
ce qu'elle comprend : 

- la mise en contact d ! une substance a tester avec un animal transg6- 
nique selon la revendication 16, et 
20 - la mesure de la survie de Tanimal. 

19°) Reactif de criblage de substances insecticides, caracterise en ce 
qu'il est selectionne dans le groupe constitue par les ac6tylcholinesterases selon Tune 
quelconque des revendications 1 a 4, les vecteurs recombinants selon la revendication 
12, les cellules modifiees selon la revendication 13 et les animaux transgeniques selon 
25 la revendication 16. 

20°) Trousse de detection et/ou de criblage, caracterisee en ce qu'elle 
inclut au moins un rSactif selon la revendication 15 ou la revendication 19. 
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gEPDNPNSNR 
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DALDKMVGDY 
DALDKMVGDY 
DALDKMVGDY 
DALDKMVGDY 
DALDKMVGDY 
DALDKMVGDY 
DALDKMVGDY 



HFTCNVNEFA 
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HFTCNVNEFA 
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QRYAEEGNNV 
QRYAEEGNNV 
QRYAEEGNNV 
QRYAEEGNNV 
QRYAEEGNNV 
QRYAEEGNNV 



YMYLYTHRSK 
YMYLYTHRSK 
YMYLYTHRSK 
YMYLYTHRSK 
YMYLYTHRSK 
YMYLYTHRSK 
YMYLYTHRSK 
YMYLYTHRSK 
^MYLYTHRSK 
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B 



Acel-SLAB 
Acel-SR 



Acel-SLAB 
Acel-SR 



Acel-SLAB 
Acel-SR 



♦ 20 • 40 • SO • 80-; 

ATj^AACCGGACAACCCGAACAGCAACCGTGACGCGCTGGACAAGATCW ,-" 
ATf|GAACCGGACAACCCGAACAGCAACCGTGAOGCGCTCGACAA^ 

EcoRI • 100 • 120 • 140 • 160' 

CGAf&TTCG CCCAG CGGTACG CCGAGGAGGGCAACAACGTGTTCATGTAC CTGT ACACGC ACAG AAG CAAAGG AAATCCCT., 
CGAJ§ITCGCCCAGCGGTACGCCGAGGAGGGCAACAATGTGT^ ' 

« iso • 200 • 220 * 240 

GGCCGsAGKjTGGAcBgGCGTGATGCACGGOQACGAGA 

GGCCGAGGTGGACraGG CGTG ATGCACGGCGACGAG AT CAACTACGTGTTTGG CGAACCGCTG AACTCGG C CCTCGGCTAC 



• 260 * 

Ace 1 - SLAB CAGGACGACGAGAAGGA CTTTA GCCGGAAAATT 
Ace 1 - SR CAGGACGAOGAGAAGGACTTTAGCCGGAAAATT 



S-LAB 



SR Back-cross 




IS! ; 




106 bp 
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LISTE DE SEQUENCES 

<110> CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE -CNRS 

<120> Nouveau gene de 1 ' ac£tylcholines£rase responsable de la 
resistance aux insecticides et ses applications 



<130> SF644FR80 



<140> 



<141> 
<160> 53 

<170> Patentln Ver. 2.1 



<210> 1 
<211> 524 
<212> PRT 

<213> Anopheles gambiae 
<400> 1 

Asp Pro Leu Val Val Asn Thr Asp Lys Ghy Arg lie Arg Gly He Thr 
15 10 15 

Val Asp Ala Pro Ser Gly Lys Lys Val Asp Val Trp Leu Gly lie Pro 
20 25 30 

Tyr Ala Gin Pro Pro Val Gly Pro Leu Arg Phe Arg His Pro Arg Pro 
35 40 45 

Ala Glu Lys Trp Thr Gly Val Leu Asn Thr Thr Thr Pro Pro Asn Ser 
50 " " 55 60 

Cys Val Gin He Val Asp Thr Val Phe Gly Asp Phe Pro Gly Ala Thr 
65 70 75 80 

Met Trp Asn Pro Asn Thr Pro Leu Ser Glu Asp Cys Leu Tyr He Asn 
85 90 95 

Val Val Ala Pro Arg Pro Arg Pro Lys Asn Ala Ala Val Met Leu Trp 
100 105 110 

lie Phe Gly Gly Gly Phe Tyr Ser Gly Thr Ala Thr Leu Asp Val Tyr 
115 120 125 

Asp His Arg Ala Leu Ala Ser Glu Glu Asn Val He Val Val Ser Leu 
130 135 140 

Gin Tyr Arg Val Ala Ser Leu Gly Phe Leu Phe Leu Gly Thr Pro Glu 
145 150 155 160 

Ala Pro Gly Asn Ala Gly Leu Phe Asp Gin Asn Leu Ala Leu Arg Trp 
165 170 175 

Val Arg Asp Asn He His Arg Phe -Gly Gly Asp Pro Ser Arg Val Thr 
180 185 190 



2 



f 



Leu Phe Gly Glu Ser Ala Gly Ala Val Ser Val Ser Leu His Leu Leu 
195 200 205 

Ser Ala Leu Ser Arg Asp Leu Phe Gin Arg Ala lie Leu Gin Ser Gly 
210 215 220 

Ser Pro Thr Ala Pro Trp Ala Leu Val Ser Arg Glu Glu Ala Thr Leu 
225 230 235 240 

Arg Ala Leu Arg Leu Ala Glu Ala Val Gly Cys Pro His Glu Pro Ser 
245 250 255 

Lys Leu Ser Asp Ala Val Glu Cys Leu Arg Gly Lys Asp Pro His Val 
260 265 270 

Leu Val Asn Asn Glu Trp Gly Thr Leu Gly He Cys Glu Phe Pro Phe 
275 280 285 

Val Pro Val Val Asp Gly Ala Phe Leu Asp Glu Thr Pro Gin Arg Ser 
290 295 300 

Leu Ala Ser Gly Arg Phe Lys Lys Thr Glu He Leu Thr Gly Ser Asn 
305 310 , 315 320 

Thr Glu Glu Gly Tyr Tyr Phe He He Tyr Tyr Leu Thr Glu Leu Leu 
325 330 335 

Arg Lys Glu Glu Gly Val Thr Val Thr Arg Glu Glu Phe Leu Gin Ala 
340 * 345 350 

Val Arg Glu Leu Asn Pro Tyr Val Asn Gly Ala Ala Arg Gin Ala He 
355 360 365 

Val Phe Glu Tyr Thr Asp Trp Thr Glu Pro Asp Asn Pro Asn Ser Asn 
370 375 380 

Arg Asp Ala Leu Asp Lys Met Val Gly Asp Tyr His Phe Thr Cys Asn 
385 390 395 400 

Val Asn Glu Phe Ala Gin Arg Tyr Ala Glu Glu Gly Asn Asn Val Tyr 
405 410 415 

Met Tyr Leu Tyr Thr His Arg Ser Lys Gly Asn Pro Trp Pro Arg Trp 
420 425 430 

Thr Gly Val Met His Gly Asp Glu He Asn Tyr Val Phe Gly Glu Pro 
435 440 445 

Leu Asn Pro Thr Leu Gly Tyr Thr Glu Asp Glu Lys Asp Phe Ser Arg 
450 455 460 

Lys He Met Arg Tyr Trp Ser Asn Phe Ala Lys Thr Gly Asn Pro Asn 
465 " 470 475 480 

Pro Asn Thr Ala Ser Ser Glu Phe Pro Glu Trp Pro Lys His Thr Ala 



485 



490 



495 



1 er depot 



3 ' ' 

His Gly Arg His Tyr Leu Glu Leu Gly Leu Asn Thr Ser Phe Val Gly 
500 505 510 

Arg Gly Pro Arg Leu Arg Gin Cys Ala Phe Trp Lys 
515 520 



<210> 2 
<211> 1932 
-CZY2>~ ADN 
<213> Anopheles gambiae 



<220> 

<221> CDS 

<222> (1) . . (1932) 



<400> 2 

atg ttt gtg tgt tgt ttt ttc ttt etc tct etc tct ttc tgt ggt tec 

Met Phe Val Cys Cys Phe Phe Phe Leu Ser Leu Ser Phe Cys Gly Ser 

1 5 10 15 



48 



aac att tea gac gca ttt ttt aca cca ta,t ata ggt cac ggt gag tec 
Asn lie Ser Asp Ala Phe Phe Thr Pro Tyr He Gly His Gly Glu Ser 
20 25 30 



96 



gta cga att ata gat gee gag ttg ggc acg etc gag cat gtc cac agt 
Val Arg He lie Asp Ala Glu Leu Gly Thr Leu Glu His Val His Ser 
35 40 45 



144 



gga gca acg ccg egg cga cgc ggc ctg acg agg cgc gag tea aac teg 
Gly Ala Thr Pro Arg Arg Arg Gly Leu Thr Arg Arg Glu Ser Asn Ser 
50 " 55 60 



192 



gac gcg aac gac aac gat ccg ctg gtg gtc aac acg gat aag ggg cgc 
Asp Ala Asn Asp Asn Asp Pro Leu Val Val Asn Thr Asp Lys Gly Arg 
65 70 75 80 



240 



ate cgc ggc att acg gtc gat gcg ccc age ggc aag aag gtg gac gtg 
He Arg Gly He Thr Val Asp Ala Pro Ser Gly Lys Lys Val Asp Val 
85 90 95 



288 



tgg etc ggc att ccc tac gee cag ccg ccg gtc ggg ccg eta egg ttc 
Trp Leu Gly He Pro Tyr Ala Gin Pro Pro Val Gly Pro Leu Arg Phe 
100 105 110 



336 



cgt cat ccg egg ccg gee gaa aag tgg acc ggc gtg ctg aac acg acc 
Arg His Pro Arg Pro Ala Glu Lys Trp Thr Gly Val Leu Asn Thr Thr 
115 120 125 



384 



aca ccg ccc aac age tgc gtg cag ate gtg gac acc gtg ttc ggc gac 
Thr Pro Pro Asn Ser Cys Val Gin He Val Asp Thr Val Phe Gly Asp 
130 135 140 



432 



ttc ccg ggc gcg acc atg tgg aac ccg aac acg ccc ctg tec gag gac 
Phe Pro Gly Ala Thr Met Trp Asn Pro Asn Thr Pro Leu Ser Glu Asp 
145 " 150 155 160 



480 



tgt ctg tac att aac gtg gtg gca ccg cga ccc egg ccc aag aat gcg 
Cvs Leu Tyr lie Asn Val Val Ala Pro Arg Pro Arg Pro Lys Asn Ala 
165 170 175 



acc ctg gac gtg tac gac cac egg gcg ctt gcg teg gag gag aac gtg 
Thr Leu Asp Val Tyr Asp His Arg Ala Leu Ala Ser Glu Glu Asn Val 
195 200 205 



aag gac ccg cac gtg ctg gtc aac aac gag tgg ggc acg etc ggc att 
Lys Asp Pro His Val Leu Val Asn Asn Glu Trp Gly Thr Leu Gly lie 
340 345 350 



528 



gec gtc atg ctg tgg ate ttc ggc ggc ggc ttc tac tec ggc acc gec 576 
Ala Val Met Leu Trp He Phe Gly Gly Gly Phe Tyr Ser Gly Thr Ala 
180 185 190 



624 



ate gtg gtg teg ctg cag tac cgc gtg gee agt ctg ggc ttc ctg ttt 672 
He Val Val Ser Leu Gin Tyr Arg Val Ala Ser Leu Gly Phe Leu Phe 
210 215 220 

etc ggc acc ccg gaa gcg ccg ggc aat gcg gga ctg ttc gat cag aac 720 
Leu Gly Thr Pro Glu Ala Pro Gly Asn Ala Gly Leu Phe Asp Gin Asn 
225 230 235 240 

ctt gcg eta cgc tgg gtg egg gac aac att cac egg ttc ggt ggc gat 7 68 
Leu Ala Leu Arg Trp Val Arg Asp Asn He His Arg Phe Gly Gly Asp 
245 250 255 

ccg teg cgt gtg aca ctg ttc ggc gag agt gee ggt gee gtc teg gtg 816 
Pro Ser Arg Val Thr Leu Phe Gly Glu Ser Ala Gly Ala Val Ser Val 
260 265 270 



teg ctg cat ctg ctg tec gec ctt tec cgc gat ctg ttc cag egg gec 864 
Ser Leu His Leu Leu Ser Ala Leu Ser Arg Asp Leu Phe Gin Arg Ala 
275 280 285 

ate ctg cag age ggc teg ccg acg gca ccg tgg gca ttg gta teg cgc 912 
He Leu Gin Ser Gly Ser Pro Thr Ala Pro Trp Ala Leu Val Ser Arg 
290 295 300 

gag gaa gec aca eta aga gca ctg egg ttg gec gag gcg gtc ggc tgc 960 
Glu Glu Ala Thr Leu Arg Ala Leu Arg Leu Ala Glu Ala Val Gly Cys 
305 310 315 320 

ccg cac gaa ccg age aag ctg age gat gcg gtc gag tgc ctg cgc ggc 1008 
Pro His Glu Pro Ser Lys Leu Ser Asp Ala Val Glu Cys Leu Arg Gly 
325 330 335 



1056 



tgc gag ttc ccg ttc gtg ccg gtg gtc gac ggt gcg ttc ctg gac gag 1104 
Cys Glu Phe Pro Phe Val Pro Val Val Asp Gly Ala Phe Leu Asp Glu 
355 360 365 

acg ccg cag cgt teg etc gec age ggg cgc ttc aag aag acg gag ate 1152 
Thr Pro Gin Arg Ser Leu Ala Ser Gly Arg Phe Lys Lys Thr Glu He 
370 375 380 



etc acc ggc age aac acg gag gag ggc tac tac ttc ate ate tac tac 1200 
Leu Thr Gly Ser Asn Thr Glu Glu Gly Tyr Tyr Phe lie lie Tvr Tvr 
385 390 395 400 

ctg acc gag ctg ctg cgc aag gag gag ggc gtg acc gtg acg cgc gag 124 8 
Leu Thr Glu Leu Leu Arg Lys Glu Glu Gly Val Thr Val Thr Arg Glu 
405 410 415 

gag ttc ctg cag gcg gtg cgc gag etc aac ccg tac gtg aac ggg gcg 1296 
£iH -Phe_Leu_GJ^ JU^^ — - 

420 425 " 430 

gee egg cag gcg ate gtg ttc gag tac acc gac tgg acc gag ccg gac 1344 
Ala Arg Gin Ala lie Val Phe Glu Tyr Thr Asp Trp Thr Glu Pro Asp 
435 440 445 " 

aac ccg aac age aac egg gac gcg ctg gac aag atg gtg ggc gac tat 1392 
Asn Pro Asn Ser Asn Arg Asp Ala Leu Asp Lys Met Val Gly Asp Tyr 
450 455 . 460 

tft tt C ^° l qC l a ° gtg aa ° gag ttc gCg ca * c 99 tac 9 CC S a g ^g 1440 
His Phe Thr Cys Asn Val Asn Glu Phe Ala Gin Arg Tyr Ala Glu Glu 

465 470 ,475 " 480 

£ HI 11° £ aC atg tat ctg tac acg cac cgc age aaa ggc aac 1488 
Gly Asn Asn Val Tyr Met Tyr Leu Tyr Thr His Arg Ser Lys Gly Asn 
485 490 495 

ccg tgg ccg cgc tgg acg ggc gtg atg cac ggc gac gag ate aac tac 1536 
Pro Trp Pro Arg Trp Thr Gly Val Met His Gly Asp 111 He Asn Tyr 
500 505 510 

v fc ? tt° ?? C 5f 3 CCg CtC aac OCC acc ctc SS C tac acc gag gac gag 1584 
Val Phe Gly Glu Pro Leu Asn Pro Thr Leu Gly Tyr Thr 111 Asp ?iu 
515 520 525 

aaa gac ttt age egg aag ate atg cga tac tgg tec aac ttt gec aaa 
Lys Asp Phe Ser Arg Lys He Met Arg Tyr Trp Ser Asn Phe Ala Lys 
530 535 54Q 

th^ r^ 9 a** «° a aSt ° CC aaC acg gcc a 9° a S c gaa ttc ccc gag tgg 
Thr Gly Asn Pro Asn Pro Asn Thr Ala Ser Ser Glu Phe Pro llu £S 

545 550 555 560 

ccc aag cac acc gcc cac gga egg cac tat ctg gag ctg qqc ctc aac 
Pro Lys His Thr Ala His Gly Arg His Tyr Levi 111 Leu Sly Leu tin 
565 570 575 

Tht Ser Phe vtl ??f »" C " ttg agg Cag tgt * cc ttc tgg 1776 

Thr Ser Phe Val Gly Arg Gly Pro Arg Leu Arg Gin Cys Ala Phe Tro 

580 sag 590 

III III lit r C " S~ ?f a ??* f CC tcg aa = eta cca ggg 1824 

Asn 

605 



1632 



1680 



1728 



- v-i-ci yii gca gcr acc tea aac eta cca nnn 

Lys Lys Tyr Leu Pro Gin Leu Val Ala Ala Thr Ser Asn Leu Pro 111 

600 



6 ' f 

cca gca ccg cct agt gaa ccg tgc gaa age age gca ttt ttt tac cga 1872 

Pro Ala Pro Pro Ser Glu Pro Cys Glu Ser Ser Ala Phe Phe Tyr Arg 
610 615 620 

cct gat ctg ate gtg ctg ctg gtg teg ctg ctt acg gcg acc gtc aga 1920 

Pro Asp Leu lie Val Leu Leu Val Ser Leu Leu Thr Ala Thr Val Arg 
625 630 635 640 

ttc ata caa taa 1932 
Phe He Gin 



<210> 3 
<211> 643 
<212> PRT 

<213> Anopheles gambiae 
<400> 3 

Met Phe Val Cys Cys Phe Phe Phe Leu Ser Leu Ser Phe Cys Gly Ser 
15 10 15 

Asn He Ser Asp Ala Phe Phe Thr Pro Tyr He Gly His Gly Glu Ser 
20 25 , 30 

Val Arg He He Asp Ala Glu Leu Gly Thr Leu Glu His Val His Ser 
35 40 45 

Gly Ala Thr Pro Arg Arg Arg Gly Leu Thr Arg Arg Glu Ser Asn Ser 
50 55 60 

Asp Ala Asn Asp Asn Asp Pro Leu Val Val Asn Thr Asp Lys Gly Arg 

65 70 75 ' . 80 

He Arg Gly He Thr Val Asp Ala Pro Ser Gly Lys Lys Val Asp Val 
85 90 95 

Trp Leu Gly He Pro Tyr Ala Gin Pro Pro Val Gly Pro Leu Arg Phe 
100 105 110 

Arg His Pro Arg Pro Ala Glu Lys Trp Thr Gly Val Leu Asn Thr Thr 
115 120 125 

Thr Pro Pro Asn Ser Cys Val Gin He Val Asp Thr Val Phe Gly Asp 
130 135 140 

Phe Pro Gly Ala Thr Met Trp Asn Pro Asn Thr Pro Leu Ser Glu Asp 
145 150 155 160 

Cys Leu Tyr He Asn Val Val Ala Pro Arg Pro Arg Pro Lys Asn Ala 
165 170 175 

Ala Val Met Leu Trp He Phe Gly Gly Gly Phe Tyr Ser Gly Thr Ala 
180 185 190 

Thr Leu Asp Val Tyr Asp His Arg Ala Leu Ala Ser Glu Glu Asn Val 
195 200 205 



7 I 

He Val Val Ser Leu Gin Tyr Arg Val Ala Ser Leu Gly Phe Leu Phe 
210 215 220 

Leu Gly Thr Pro Glu Ala Pro Gly Asn Ala Gly Leu Phe Asp Gin Asn 
225 230 235 240 

Leu Ala Leu Arg Trp Val Arg Asp Asn He His Arg Phe Gly Gly Asp 
245 250 255 



Pro Ser A rg Va l Thr Leu Phe G ly Glu Ser_Ala_Glv_A1 a V*l Spr Val- 
~2"6t> 265 270 



Ser Leu His Leu Leu Ser Ala Leu Ser Arg Asp Leu Phe Gin Arg Ala 
275 280 285 

He Leu Gin Ser Gly Ser Pro Thr Ala Pro Trp Ala Leu Val Ser Arg 
290 295 300 

Glu Glu Ala Thr Leu Arg Ala Leu Arg Leu Ala Glu Ala Val Gly Cys 
305 310 315 320 

Pro His Glu Pro Ser Lys Leu Ser Asp Ala Val Glu Cys Leu Arg Gly 
325 330 335 

Lys Asp Pro His Val Leu Val Asn Asn Glu Trp Gly Thr Leu Gly He 
340 345 350 

Cys Glu Phe Pro Phe Val Pro Val Val Asp Gly Ala Phe Leu Asp Glu 
355 360 365 

Thr Pro Gin Arg Ser Leu Ala Ser Gly Arg Phe Lys Lys Thr Glu He 
370 375 380 

Leu Thr Gly Ser Asn Thr Glu Glu Gly Tyr Tyr Phe He He Tyr Tyr 
385 390 395 400 

Leu Thr Glu Leu Leu Arg Lys Glu Glu Gly Val Thr Val Thr Arg Glu 
405 410 415 

Glu Phe Leu Gin Ala Val Arg Glu Leu Asn Pro Tyr Val Asn Gly Ala 
420 425 430 

Ala Arg Gin Ala He Val Phe Glu Tyr Thr Asp Trp Thr Glu Pro Asp 
435 440 445 

Asn Pro Asn Ser Asn Arg Asp Ala Leu Asp Lys Met Val Gly Asp Tyr 
450 455 460 



His Phe Thr Cys Asn Val Asn Glu Phe Ala Gin Arg Tyr Ala Glu Glu 
465 470 475 * - 480 

Gly Asn Asn Val Tyr Met Tyr Leu Tyr Thr His Arg Ser Lys Gly Asn 
485 490 495 

Pro Trp Pro Arg Trp Thr Gly Val Met His Gly Asp Glu He Asn Tyr 
500 505 510 



8 



f 



Val Phe Gly Glu Pro Leu Asn Pro Thr Leu Gly Tyr Thr Glu Asp Glu 
515 520 " ~ 525 

Lys Asp Phe Ser Arg Lys lie Met Arg Tyr Trp Ser Asn Phe Ala Lys 
530 535 540 

Thr Gly Asn Pro Asn Pro Asn Thr Ala Ser Ser Glu Phe Pro Glu Trp 
545 550 555 560 

Pro Lys His Thr Ala His Gly Arg His Tyr Leu Glu Leu Gly Leu Asn 
565 570 575 

Thr Ser Phe Val Gly Arg Gly Pro Arg Leu Arg Gin Cys Ala Phe Trp 
580 585 590 

Lys Lys Tyr Leu Pro Gin Leu Val Ala Ala Thr Ser Asn Leu Pro Gly 
595 600 605 

Pro Ala Pro Pro Ser Glu Pro Cys Glu Ser Ser Ala Phe Phe Tyr Arg 
610 615 620 

Pro Asp Leu lie Val Leu Leu Val Ser Leu Leu Thr Ala Thr Val Arg 
625 630 635 640 



Phe He Gin 



<210> 4 
<211> 1932 
<212> ADN 

<213> Anopheles gambiae souche KISCJMU 

<220> 

<221> CDS 

<222> (1) (1932) 

<400> 4 

atg ttt gtg tgt tgt ttt ttc ttt etc tct etc tct etc tgt ggt tec 48 
Met Phe Val Cys Cys Phe Phe Phe Leu Ser Leu Ser Leu Cys Gly Ser 
1 5 10 " 15 

aac att tea gac gca ttt ttt aca cca tat ata ggt cac ggt gag tec 96 
Asn He Ser Asp Ala Phe Phe Thr Pro Tyr He Gly His Gly Glu Ser 
20 25 " 30 

gta cga att ata gat gee gag ttg ggc acg etc gag cat gtc cac agt 14 4 
Val Arg He lie Asp Ala Glu Leu Gly Thr Leu Glu His Val His Ser 
35 40 45 

gga gca acg ccg egg cga cgc ggt ctg acg agg cgc gag tec aac teg 192 
Gly Ala Thr Pro Arg Arg Arg Gly Leu Thr Arg Arg Glu Ser Asn Ser 
50 55 60 



gac gcg aac gac aac gat 
Asp Ala Asn Asp Asn Asp 
65 70 



ccg ctg gtg gtc aac acg gat aag ggg cgc 
Pro Leu Val Val Asn Thr Asp Lys Gly Arg 
75 80 



240 



9 ' 

ate cgc ggc att acg gtc gat gcg ccc age ggc aag aag gtg gac gtg 288 
lie Arg Gly lie Thr Val Asp Ala Pro Ser Gly Lys Lys Val Asp Val 
85 90 95 

tgg etc gge att ccc tac gee cag ccg ccg gtc ggg ccg tta egg ttc 336 
Trp Leu Gly He Pro Tyr Ala Gin Pro Pro Val Gly Pro Leu Arg Phe 
100 105 110 



cgt cat ccg egg ccg gee gaa aag tgg acc ggc gtg ctg aac acg acc 384 

Arg His Pro Arg Pro Al a G lu Ly s Trp Thr Gl y Val Leu Asn Thr T hr 

TT5 T2~Q 125 

aca ccg ccc aac age tgc gtg cag ate gtg gac acc gtg ttc ggc gac 432 
Thr Pro Pro Asn Ser Cys Val Gin He Val Asp Thr Val Phe Gly Asp 
130 135 140 

ttc ccg ggc gcg acc atg tgg aac ccg aac acg ccc ctg tec gag gac 4 80 
Phe Pro Gly Ala Thr Met Trp Asn Pro Asn Thr Pro Leu Ser Glu Asp 
145 150 155 160 

tgt ctg tac att aac gtg gtg gca ccg cga ccc egg ccc aag aat gcg 528 
Cys Leu Tyr He Asn Val Val Ala Pro Arg Pro Arg Pro Lys Asn Ala 
165 . 17/) 175 

gee gtc atg ctg tgg ate ttc ggc ggc ggc ttc tac tec ggc acc gec 576 
Ala Val Met Leu Trp He Phe Gly Gly Gly Phe Tyr Ser Gly Thr Ala 
180 185 " 190 

acc ctg gac gtg tac gac cac egg gcg ctt gcg teg gag gag aac gtg 624 
Thr Leu Asp Val Tyr Asp His Arg Ala Leu Ala Ser Glu Glu Asn Val 
195 200 205 

ate gtg gtg teg ctg cag tac cgc gtg gee agt ctg ggc ttc ctg ttt 672 
He Val Val Ser Leu Gin Tyr Arg Val Ala Ser Leu Gly Phe Leu Phe 
210 215 220 

etc ggc acc ccg gaa gcg ccg ggc aat gcg gga ctg ttc gat cag aac 720 
Leu Gly Thr Pro Glu Ala Pro Gly Asn Ala Gly Leu Phe Asp Gin Asn 
225 230 235 240 

ctt gcg eta cgc tgg gtg egg gac aac att cac egg ttc ggt ggt gat 768 
Leu Ala Leu Arg Trp Val Arg Asp Asn He His Arg Phe Gly Gly Asp 
245 250 255 

ccg teg cgt gtg aca ctg ttc ggc gag agt gee ggt gee gtc teg gtg 816 
Pro Ser Arg Val Thr Leu Phe Gly Glu Ser Ala Gly Ala Val Ser Val 
260 265 270 

teg ctg cat ctg ctg tec gee ctg tec cgc gat ctg ttc cag egg gee 864 
Ser Leu His Leu Leu Ser Ala Leu Ser Arg Asp Leu Phe Gin Arg Ala 
275 280 285 

ate ctg cag age ggc teg ccg acg gca ccg tgg gca ttg gta teg cgc 912 
He Leu Gin Ser Gly Ser Pro Thr Ala Pro Trp Ala Leu Val Ser Arg 
290 295 300 

gag gaa gee acg eta aga gca ctg egg ttg gee gag gcg gtc ggc tgc 960 
Glu Glu Ala Thr Leu Arg Ala Leu Arg Leu Ala Glu Ala Val Gly Cys 



10 ' 

305 310 315 320 

ccg cac gaa ccg age aag ctg age gat gcg gtc gag tgt ctg cgc ggc 1008 
Pro His Glu Pro Ser Lys Leu Ser Asp Ala Val Glu Cys Leu Arg Gly 
325 330 335 

aag gat ccg cac gtg ctg gtc aac aac gag tgg ggc acg etc ggc att 1056 
Lys Asp Pro His Val Leu Val Asn Asn Glu Trp Gly Thr Leu Gly lie 
340 345 350 

tgc gag ttc ccg ttc gtg ccg gtg gtc gac ggt gcg ttc ctg gac gag 1104 
Cys Glu Phe Pro Phe Val Pro Val Val Asp Gly Ala Phe Leu Asp Glu 
355 360 " 365 

acg ccg cag cgt teg etc gec age ggg cgc ttc aag aag acg gag ate 1152 
Thr Pro Gin Arg Ser Leu Ala Ser Gly Arg Phe Lys Lys Thr Glu lie 
370 375 380 

etc acc ggc age aac acg gag gag ggc tac tac ttc ate ate tac tac 1200 
Leu Thr Gly Ser Asn Thr Glu Glu Gly Tyr Tyr Phe lie lie Tyr Tyr 
385 390 395 400 

ctg acc gag ctg ctg cgc aag gag gag ggc gtg acc gtg acg cgc gag 1248 
Leu Thr Glu Leu Leu Arg Lys Glu Glu Gly Val Thr Val Thr Arg Glu 
405 410 415 

gag ttc ctg cag gcg gtg cgc gag etc aac ccg tac gtg aac ggg gcg 12 96 
Glu Phe Leu Gin Ala Val Arg Glu Leu Asn Pro Tyr Val Asn Gly Ala 
420 425 430 

gec egg cag gcg ate gtg ttc gag tac acc gac tgg acc gag ccg gac 134 4 
Ala Arg Gin Ala lie Val Phe Glu Tyr Thr Asp Trp Thr Glu Pro Asp 
435 440* 445 

aac ccg aac age aac egg gac gcg ctg gac aag atg gtg ggc gac tat 1392 
Asn Pro Asn Ser Asn Arg Asp Ala Leu Asp Lys Met Val Gly Asp Tyr 
450 455 460 

cac ttc acc tgc aac gtg aac gag ttc gcg cag egg tac gee gag gag 14 4 0 
His Phe Thr Cys Asn Val Asn Glu Phe Ala Gin Arg Tyr Ala Glu Glu 
465 470 475 " 480 

ggc aac aac gtc tac atg tat ctg tac acg cac cgc age aaa ggc aac 1488 
Gly Asn Asn Val Tyr Met Tyr Leu Tyr Thr His Arg Ser Lys Gly Asn 
485 490 495 

ccg tgg ccg cgc tgg acg ggc gtg atg cac ggc gac gag ate aac tac 1536 
Pro Trp Pro Arg Trp Thr Gly Val Met His Gly Asp Glu He Asn Tyr 
500 505 510 

gtg ttc ggc gaa ccg etc aac ccc acc etc ggc tac acc gag gac gag 1584 
Val Phe Gly Glu Pro Leu Asn Pro Thr Lea Gly Tyr Thr Glu Asp Glu 
515 520 525 

aaa gac ttt age egg aag ate atg cga tac tgg tct aac ttt gec aaa 1632 
Lys Asp Phe Ser Arg Lys He Met Arg Tyr Trp Ser Asn Phe Ala Lys 
530 535 540 
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acc ggg aat cca aat ccc aac acg gcc age age gaa ttc ccc gag tgg 1680 

Thr Gly Asn Pro Asn Pro Asn Thr Ala Ser Ser Glu Phe Pro Glu Trp 

545 550 555 560 

ccc aag cac acc gcc cac gga egg cac tat ctg gag ctg ggc etc aac 1728 

Pro Lys His Thr Ala His Gly Arg His Tyr Leu Glu Leu Gly Leu Asn 

565 570 575 

acg tec ttc gtc ggt egg ggc cca egg ttg agg cag tgt gcc ttc tgg 1776 

Thr Ser Phe Val Gly Arg Gl y Pro Arg Leu_ Arj?_GLQ-Cvs^AlaL-JBh&^Cro 



580 " " 585 590 

aag aag tac ctt ccc cag eta gtt gca get acc teg aac eta cca ggg 1824 
Lys Lys Tyr Leu Pro Gin Leu Val Ala Ala Thr Ser Asn Leu Pro Gly 
595 600 605 

cca gca ccg ccc agt gaa ccg tgc gaa age age gca ttt ttt tac cga 1872 
Pro Ala Pro Pro Ser Glu Pro Cys Glu Ser Ser Ala Phe Phe Tyr Arg 
610 615 620 

cct gat ctg ate gtg ctg ctg gtg teg ctg ctt acg gcg acc gtc aga 1920 
Pro Asp Leu lie Val Leu Leu Val Ser Leu Leu Thr Ala Thr Val Arg 
625 630 , 635 640 

ttc ata caa taa 1932 
Phe lie Gin 



<210> 5 
<211> 643 
<212> PRT 

<213> Anopheles gambiae souche KISOMU 
<400> 5 

Met Phe Val Cys Cys Phe Phe Phe Leu Ser Leu Ser Leu Cys Gly Ser 
. 15 10 ' 15 

Asn lie Ser Asp Ala Phe Phe Thr Pro Tyr lie Gly His Gly Glu Ser 
20 25 30 

Val Arg lie He Asp Ala Glu Leu Gly Thr Leu Glu His Val His Ser 
35 40 45 

Gly Ala Thr Pro Arg Arg Arg Gly Leu Thr Arg Arg Glu Ser Asn Ser 
50 55 60 

Asp Ala Asn Asp Asn Asp Pro Leu Val Val Asn Thr Asp Lys Gly Arg 
65 70 75 " * 80 

He Arg Gly He Thr Val Asp Ala Pro Ser Gly Lys Lys Val Asp Val 
85 90 " 95 

Trp Leu Gly He Pro Tyr Ala Gin Pro Pro Val Gly Pro Leu Arg Phe 
100 105 110 

Arg His Pro Arg Pro Ala Glu Lys Trp Thr Gly Val Leu Asn Thr Thr 
115 120 125 
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Thr Pro Pro Asn Ser Cys Val Gin He Val Asp Thr Val Phe Gly Asp 
130 135 140 

Phe Pro Gly Ala Thr Met Trp Asn Pro Asn Thr Pro Leu Ser Glu Asp 
145 150 155 160 

Cys Leu Tyr lie Asn Val Val Ala Pro Arg Pro Arg Pro Lys Asn Ala 
165 170 175 

Ala Val Met Leu Trp He Phe Gly Gly Gly Phe Tyr Ser Gly Thr Ala 
180 185 190 

Thr Leu Asp Val Tyr Asp His Arg Ala Leu Ala Ser Glu Glu Asn Val 
195 200 205 

He Val Val Ser Leu Gin Tyr Arg Val Ala Ser Leu Gly Phe Leu Phe 
210 215 220 

Leu Gly Thr Pro Glu Ala Pro Gly Asn Ala Gly Leu Phe Asp Gin Asn 
225 230 235 240 

Leu Ala Leu Arg Trp Val Arg Asp Asn He His Arg Phe Gly Gly Asp 
245 250 255 

Pro Ser Arg Val Thr Leu Phe Gly Glu Ser Ala Gly Ala Val Ser Val 
260 265 270 

Ser Leu His Leu Leu Ser Ala Leu Ser Arg Asp Leu Phe Gin Arg Ala 
275 280 285 

He Leu Gin Ser Gly Ser Pro Thr Ala Pro Trp Ala Leu Val Ser Arg 
290 295 300 

Glu Glu Ala Thr Leu Arg Ala Leu Arg Leu Ala Glu Ala Val Gly Cys 
305 310 315 320 

Pro His Glu Pro Ser Lys Leu Ser Asp Ala Val Glu Cys Leu Arg Gly 
325 330 335 

Lys Asp Pro His Val Leu Val Asn Asn Glu Trp Gly Thr Leu Gly He 
340 345 350 

Cys Glu Phe Pro Phe Val Pro Val Val Asp Gly Ala Phe Leu Asp Glu 
355 360 365 

Thr Pro Gin Arg Ser Leu Ala Ser Gly Arg Phe Lys Lys Thr Glu He 
370 375 380 

Leu Thr Gly Ser Asn Thr Glu Glu Gly Tyr Tyr Phe He He Tyr Tyr 
385 390 395 400 

Leu Thr Glu Leu Leu Arg Lys Glu Glu Gly Val Thr Val Thr Arg Glu 
405 • 410 415 

Glu Phe Leu Gin Ala Val Arg Glu Leu Asn Pro Tyr Val Asn Gly Ala 



420 



425 



430 
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Ala Arg Gin Ala He Val Phe Glu Tyr Thr Asp Trp Thr Glu Pro Asp 

435 440 445 

Asn Pro Asn Ser Asn Arg Asp Ala Leu Asp Lys Met Val Gly Asp Tyr 
^50 455 460 

His Phe Thr Cys Asn Val Asn Glu Phe Ala Gin Arg Tyr Ala Glu Glu 

465 470 475 ' " 480 



— GJy^As n Asn Val Xyr~Me4s- -3tyr— Beu -Tyi — rfrr~Hl~5 Arg Ser Lys G Ty~Asn~ 

485 490 495 

Pro Trp Pro Arg Trp Thr Gly Val Met His Gly Asp Glu He Asn Tyr 
500 505 ~ " 510 

Val Phe Gly Glu Pro Leu Asn Pro Thr Leu Gly Tyr Thr Glu Asp Glu 
515 520 525 

Lys Asp Phe Ser Arg Lys He Met Arg Tyr Trp Ser Asn Phe Ala Lys 
5 30 535 540 

Thr Gly Asn Pro Asn Pro Asn Thr Ala Ser Ser Glu Phe Pro Glu Trp 
545 550 , 555 560 

Pro Lys His Thr Ala His Gly Arg His Tyr Leu Glu Leu Gly Leu Asn 
565 570 575 

Thr Ser Phe Val Gly Arg Gly Pro Arg Leu Arg Gin Cys Ala Phe Trp 
580 585 590 

Lys Lys Tyr Leu Pro Gin Leu Val Ala Ala Thr Ser Asn Leu Pro Gly 
595 600 605 

Pro Ala Pro Pro Ser Glu Pro Cys Glu Ser Ser Ala Phe Phe Tyr Arg 
610 615 620 

Pro Asp Leu He Val Leu Leu Val Ser Leu Leu Thr Ala Thr Val Arg 
625 "0 635 640 

Phe He Gin 



<210> 6 
<211> 3297 
<212> ADN 

<213> Culex pipiens souche S-LAB 
<400> 6 

ccagagcaga ccacgaacct cgtcggaaga 
gtgtaagcaa ataaggttag gacacaccgt 
gccgtcactg acgagaagaa aaagaaacaa 
gccagagagc acaccaagag tcacattgag 
gttcaagaag gaagctaata ccacacacac 
cagcaggcgg cgctgtgaaa ttcacacgtt 
gtcggagtag caattagtga attacaaaca 
accagtggaa ccagtggtgc agtgagtgat 
cgcgacgagc acactcttgt gaaatcggtg 



gctgatgccg ttgtgacatt cgctccgatt 60 
attcacgaac tctgacacca agctgtcata 120 
gagtcgacaa cacactcaca gtctcacgcc 180 
aaaaccacac gccagaagaa aagaagagtt 240 
acacactcac acacaccggg agaaaccgca 300 
cggtcggtga agtggtggaa ggaactcggc 360 
aagggaaata agggaaggag tcaagagtca 420 
ttttttgtgt tgttgctgca gaaaggaacg 480 
tcatcatcgt taaatgctct cgaccgtcaa 540 



cttatagcta tcatatgcga tctctccaag ccatggagat ccgaggccta ataacccgat 600 
tactgggtcc atgtcacctg cgacatctga tactgtgcag tttggggctg tactccatcc 660 
tcgtgaagtc ggtccattgc cggcatcatg acatcggtag ttcggtggca caccagctag 720 
gatcgaaata ctcacaatca tcctcgttat cgtcatcctc gcaatcgtca tcgtcgttag 780 
ctgaagaggc cacgctgaat aaagattcag atgcattttt tacaccatat ataggtcacg 840 
gagattctgt tcgaattgta gatgccgaat taggtacatt agagcgcgag cacatccata 900 
gcactacgac ccggcggcgt ggcctgacgc ggagggagtc cagctccgat gccaccgact 960 
cggacccact ggtcataacg acggacaagg gcaaaatccg tggaacgaca ctggaagcgc 1020 
ctagtggaaa gaaggtggac gcatggatgg gcattccgta cgcgcagccc ccgctgggtc 1080 
cgctccggtt tcgacatccg cgaccggccg aaagatggac cggtgtgctg aacgcgacca 114 0 
aaccgcccaa ctcctgcgtc cagatcgtgg acaccgtgtt cggtgacttc ccgggggcca 1200 
ccatgtggaa cccgaacaca ccgctctcgg aggactgtct gtacatcaac gtggtcgtgc 1260 
cacggcccag gcccaagaat gccgccgtca tgctgtggat cttcgggggt ggcttctact 1320 
ccgggactgc cacgctggac gtgtacgacc atcggacgct ggcctcggag gagaacgtga 1380 
tcgtagtttc gctgcagtac cgtgtcgcaa gtcttgggtt tctcttcctc ggcacaccgg 1440 
aggcacccgg taacgcgggg ctgtttgatc agaacctggc actgagatgg gtccgcgaca 1500 
acatccaccg gttcggcggt gacccctcgc gggtcacact gttcggcgag agcgccggag 1560 
cggtctcggt ttcgctgcac ctgctgtcgg cgctctcgcg ggacctgttc cagcgggcca 1620 
tcctccagag tggctccccg acggccccgt gggcgctggt ttcgcgcgaa gaagctacgc 1680 
ttagagctct tcgtctggcc gaggccgtca actgtccgca cgatgcgacc aagctgagcg 1740 
atgccgtcga atgcctgcga accaaggatc cgaacgagct ggtcgacaac gagtggggca 1800 
cgctggggat ctgcgagttt ccgttcgttc cggttgtgga cggagccttc ctcgatgaga 1860 
caccgcagcg ttcgttggcc agcgggcgct tcaagaaaac ggacatcctg accggcagca 1920 
acaccgagga gggttactac tttatcattt actatctaac cgagctgctc aggaaagagg 1980 
aaggggtcac ggtaacacgc gaggagttcc tacaggccgt ccgggagttg aatccgtacg 204 0 
tgaacggtgc cgcccggcag gccatcgtgt tcgagtacac ggactggatt gaaccggaca 2100 
acccgaacag caaccgtgac gcgctggaca agatggtcgg ggattatcac ttcacctgca 2160 
acgtgaacga attcgcccag cggtacgccg aggagggcaa caacgtgttc atgtacctgt 2220 
acacgcacag aagcaaagga aatccctggc cgaggtggac cggcgtgatg cacggcgacg 2280 
agatcaacta cgtgtttggc gaaccgctga actcggccct cggctaccag gacgacgaga 2340 
aggactttag ccggaaaatt atgcgatact ggtccaactt tgccaagact ggcaatccca 2400 
acccgagtac gccgagcgtg gacctgcccg aatggcccaa gcacaccgcc cacggacgac 24 60 
actatctgga gctgggactg aacacgacct tcgtgggacg gggcccacga ttgcggcagt 2520 
gcgctttctg gaagaaatat ttgccgcaac tagtagcagc tacctctaac ctccaagtaa 2580 
ctcccgcgcc tagcgtacct tgcgaaagca getcaacatc ttatcgatcc actctacttc 264 0 
taatagtcac actactttta gtaacgcggt tcaagattta aatccgtgtt ttctttcccg 2700 
ttcccgtttt tccgttaaag cttctttagg tcaggtgaaa acatcaacaa gcagcatcaa 2760 
ttctactact aatactatta ctactattaa ctgaaatgga acaataagat tacctttttc 2820 
ttctaaattt gttcaactgc taattaaatt ctaaataggt gaatgcatct tgctctgcaa 2880 
acgaacgatc ggacaattat gttgtattgt ttttttcttt gtaataatat tctgtaaaca 2940 
gaggtgatat cattaatatt ttactaacca tacaataaac aaaatatttc ctgttataaa 3000 
ttgtgatgaa tatttcgctt taactacacc attgaaggtt acttaagttg aaataacaaa 3060 
aattttatat aaacaactaa caaataaaac agctgctaga gacaactaga cattaaatcg 3120 
aaaaaaacgt tattttgaaa aagagcgatt tatgcactag cggaggtgaa tcccttataa 3180 
tcttgaaaag agaggaggaa tggaagaaga agaagaagaa aatattatga tacaataaaa 3240 
ccaacatcta attctaacaa tcaactgttt actttactaa aaaaaaaaaa aaaaaaa 3297 



<210> 7 
<211> 702 
<212> PRT 

<213> Culex pipiens souche S-LAB 
<400> 7 

Met Glu lie Arg Gly Leu He Thr Arg Leu Leu Gly Pro Cys His Leu 
15 10 15 



15 



1 



Arg His Leu He Leu Cys Ser Leu Gly Leu Tyr Ser He Leu Val Lys 
20 25 30 

Ser Val His Cys Arg His His Asp He Gly Ser Ser Val Ala His Gin 
35 40 45 

Leu Gly Ser Lys Tyr Ser Gin Ser Ser Ser Leu Ser Ser Ser Ser Gin 
50 55 60 



_Ser Ser Ser Ser_L^u.JU^Glu-.Glu-A-l-a-?hr--^o-j 
65 70 75 



sp ser Asp 
80 



Ala Phe Phe Thr Pro Tyr He Gly His Gly Asp Ser Val Arg He Val 
85 90 95 

Asp Ala Glu Leu Gly Thr Leu Glu Arg Glu His He His Ser Thr Thr 
100 105 no 

Thr Arg Arg Arg Gly Leu Thr Arg Arg Glu Ser Ser Ser Asp Ala Thr 
115 120 
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Asp Ser Asp Pro Leu Val He Thr Thr Asp Lys Gly Lys He Arg Gly 
130 135 t 140 

Thr Thr Leu Glu Ala Pro Ser Gly Lys Lys Val Asp Ala Trp Met Gly 



150 



155 



160 



He Pro Tyr Ala Gin Pro Pro Leu Gly Pro Leu Arg Phe Arg His Pro 
165 170 175 

Arg Pro Ala Glu Arg Trp Thr Gly Val Leu Asn Ala Thr Lys Pro Pro 
180 185 



190 



Asn Ser Cys Val Gin He Val Asp Thr Val Phe Gly Asp Phe Pro Gly 
195 200 205 

Ala Thr Met Trp Asn Pro Asn Thr Pro Leu Ser Glu Asp Cys Leu Tyr 



215 



220 



lie Asn Val Val Val Pro Arg Pro Arg Pro Lys Asn Ala Ala Val Met 
Z25 230 235 240 

Leu Trp He Phe Gly Gly Gly Phe Tyr Ser Gly Thr Ala Thr Leu Asp 
245 250 255 

Val Tyr Asp His Arg Thr Leu Ala Ser Glu Glu Asn Val He Val Val 
260 265 270 

Ser Leu Gin Tyr Arg Val Ala Ser Leu Gly Phe Leu Phe Leu Gly Thr 



280 



285 



Pro Glu Ala Pro Gly Asn Ala Gly Leu Phe Asp Gin Asn Leu Ala Leu 
290 295 300 

Arg Trp Val Arg Asp Asn He His Arg Phe Gly Gly Asp Pro Ser Arg 



315 



320 



.6 

Val Thr Leu Phe Gly Glu Ser Ala Gly Ala Val Ser Val Ser Leu His 
325 330 335 

Leu Leu Ser Ala Leu Ser Arg Asp Leu Phe Gin Arg Ala lie Leu Gin 
340 345 350 

Ser Gly Ser Pro Thr Ala Pro Trp Ala Leu Val Ser Arg Glu Glu Ala 
355 360 365 

Thr Leu Arg Ala Leu Arg Leu Ala Glu Ala Val Asn Cys Pro His Asp 
370 375 380 

Ala Thr Lys Leu Ser Asp Ala Val Glu Cys Leu Arg Thr Lys Asp Pro 
385 390 395 400 

Asn Glu Leu Val Asp Asn Glu Trp Gly Thr Leu Gly lie Cys Glu Phe 
405 410 415 

Pro Phe Val Pro Val Val Asp Gly Ala Phe Leu Asp Glu Thr Pro Gin 
420 425 430 

Arg Ser Leu Ala Ser Gly Arg Phe Lys Lys Thr Asp lie Leu Thr Gly 
435 440 445 

Ser Asn Thr Glu Glu Gly Tyr Tyr Phe lie lie Tyr Tyr Leu Thr Glu 
450 455 460 

Leu Leu Arg Lys Glu Glu Gly Val Thr Val Thr Arg Glu Glu Phe Leu 
465 470 475 480 

Gin Ala Val Arg Glu Leu Asn Pro Tyr Val Asn Gly Ala Ala Arg Gin 
485 ~ 490 495 

Ala lie Val Phe Glu Tyr Thr Asp Trp lie Glu Pro Asp Asn Pro Asn 
500 505 510 

Ser Asn Arg Asp Ala Leu Asp Lys Met Val Gly Asp Tyr His Phe Thr 
515 520 525 

Cys Asn Val Asn Glu Phe Ala Gin Arg Tyr /Via Glu Glu Gly Asn Asn 
530 535 540 

Val Phe Met Tyr Leu Tyr Thr His Arg Ser Lys Gly Asn Pro Trp Pro 
545 550 555 560 

Arg Trp Thr Gly Val Met His Gly Asp Glu lie Asn Tyr Val Phe Gly 
565 570 575 

Glu Pro Leu Asn Ser Ala Leu Gly Tyr Gin Asp Asp Glu Lys Asp Phe 
580 585 " 590 

Ser Arg Lys lie Met Arg Tyr Trp Ser Asn Phe Ala Lys Thr Gly Asn 
595 600 605 



Pro Asn Pro Ser Thr Pro Ser Val Asp Leu Pro Glu Trp Pro Lys His 
610 615 620 
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Thr Ala His Gly Arg His Tyr Leu Glu Leu Gly Leu Asn Thr Thr Phe 
625 630 635 640 

Val Gly Arg Gly Pro Arg Leu Arg Gin Cys Ala Phe Trp Lys Lys Tyr 
645 650 655 

Leu Pro Gin Leu Val Ala Ala Thr Ser Asn Leu Gin Val Thr Pro Ala 
660 665 670 



■_P£2-S ec V fll Prn Cys -GLu-Ser- -Sei-^Ser-Thr-SgTr-Ty r -?Dfg Ser T hr Leu 
675 680 685 

Leu Leu He Val Thr Leu Leu Leu Val Thr Arg Phe Lys lie 
690 695 700 



<210> 8 
<211> 91 
<212> PRT 

<213> Culex pipiens 
<400> 8 

lie Glu Pro Asp Asn Pro Asn Ser Asn Arg Asp Ala Leu Asp Lys Met 
1 5 io 15 

Val Gly Asp Tyr His Phe Thr Cys Asn Val Asn Glu Phe Ala Gin Arg 
20 25 30 

Tyr Ala Glu Glu Gly Asn Asn Val Phe Met Tyr Leu Tyr Thr His Ara 
35 4 o 45 

Ser Lys Gly Asn Pro Trp Pro Arg Trp Thr Gly Val Met His Gly Asp 
50 55 60 

Glu He Asn Tyr Val Phe Gly Glu Pro Leu Asn Ser Ala Leu Gly Tyr 
65 70 • 75 80 

Gin Asp Asp Glu Lys Asp Phe Ser Arg Lys He 
85 90 



<210> 9 
<211> 91 
<212> PRT 

<213> Aedes aegypti 
<4 00> 9 

Thr Glu Pro Glu Asn Pro Asn Ser Asn Arg Asp Ala Leu Asp Lys Met 
1 5 io 15 

Val Gly Asp Tyr His Phe Thr Cys Asn Val Asn Glu Phe Ala Gin Arg 
20 25 30 

Tyr Ala Glu Glu Gly Asn Asn Val Tyr Met Tyr Leu Tyr Thr His Arg 
35 40 * 



45 




Ser Lys Gly Asn Pro Trp Pro Arg 
50 55 

Glu He Asn Tyr Val Phe Gly Glu 
65 70 

Met Glu Asp Glu Lys Asp Phe Ser 
85 




Trp Thr Gly Val Met His Gly Asp 
60 

Pro Leu Asn Ser Asp Leu Gly Tyr 
75 80 

Arg Lys He 
90 



<210> 10 
<211> 91 
<212> PRT 

<213> Aedes albopictus 
<400> 10 

Thr Glu Pro Glu Asn Pro Asn Ser Asn Arg Asp Ala Leu Asp Lys Met 
1 5 10 15 

Val Gly Asp Tyr His Phe Thr Cys Asn Val Asn Glu Phe Ala Gin Arg 
20 25 30 

Tyr Ala Glu Glu Gly Asn Asn Val Tyr Met Tyr Leu Tyr Thr His Arg 
35 40 45 

Ser Lys Gly Asn Pro Trp Pro Arg Trp Thr Gly Val Met His Gly Asp 
50 55 60 

Glu He Asn Tyr Val Phe Gly Glu Pro Leu Asn Ser Asp Leu Gly Tyr 
65 70 75 80 

Met Asp Asp Glu Lys Asp Phe Ser Arg Lys He 
85 90 



<210> 11 
<211> 91 
<212> PRT 

<213> Anopheles darlingi 
<400> 11 

Thr Glu Pro Asp Asn Pro Asn Ser Asn Arg Asp Ala Leu Asp Lys Met 
1 5 10 15 

Val Gly Asp Tyr His Phe Thr Cys Asn Val Asn Glu Phe Ala Gin Arg 
20 25 30 

Tyr Ala Glu Glu Gly Asn Asn Val Tyr Met Tyr Leu Tyr Thr His Arg 
35 40 ~ 45 

Ser Lys Gly Asn Pro Trp Pro Arg Trp Thr Gly Val Met His Gly Asp 
50 55 . 60 

Glu He Asn Tyr Val Phe Gly Glu Pro Leu Asn Pro Thr Leu Gly Tyr 
65 70 75 80 
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Thr Asp Asp Glu Lys Gly Phe Ser Arg Lys He 
85 * 90 



<210> 12 
<211> '91 
<212> PRT 

<213> Anopheles sundaicus 



<4 00> 12 

Thr Glu Pro Asp Asn Pro Asn Ser Asn Arg Asp Ala Leu Asp Lys Met 
1 5 io 15 

Val Gly Asp Tyr His Phe Thr Cys Asn Val Asn Glu Phe Ala Gin Arg 
20 25 30 

Tyr Ala Glu Glu Gly Asn Asn Val Tyr Met Tyr Leu Tyr Thr His Arq 
35 40 45 

Ser Lys Gly Asn Pro Trp Pro Arg Trp Thr Gly Val Met His Gly Asp 
50 55 60 

Glu He Asn Tyr Val Phe Gly Glu Pro Leu Asn Pro Thr Leu Gly Tyr 
65 7 <> 75 80 

Thr Glu Asp Glu Lys Asp Phe Ser Arg Lys He 
85 90 



<210> 13 
<211> 91 
<212> PRT 

<213> Anopheles minimus 
<400> 13 

Thr Glu Pro Asp Asn Pro Asn Ser Asn Arg Asp Ala Leu Asp Lys Met 
1 5 io 15 

Val Gly Asp Tyr His Phe Thr Cys Asn Val Asn Glu Phe Ala Gin Arg 
20 25 30 

Tyr Ala Glu Glu Gly Asn Asn Val Tyr Met Tyr Leu Tyr Thr His Arq 
35 40 45 

Ser Lys Gly Asn Pro Trp Pro Arg Trp Thr Gly Val Met His Gly Asp 
50 55 60 

Glu He Asn Tyr Val Phe Gly Glu Pro Leu Asn Pro Ser Leu Gly Tvr 
65 70 75 y 80 

Thr Glu Asp Glu Lys Asp Phe Ser Arg Lys He 
85 90 



<210> 14 



20 

<211> 91 
<212> PRT 

<213> Anopheles moucheti 
<400> 14 

Thr Glu Pro Asp Asn Pro Asn Ser Asn Arg Asp Ala Leu Asp Lys Met 
1 5 10 15 

Val Gly Asp Tyr His Phe Thr Cys Asn Val Asn Glu Phe Ala Gin Arg 
20 25 30 

Tyr Ala Glu Glu Gly Asn Asn Val Tyr Met Tyr Leu Tyr Thr His Arg 
35 40 ~ 45 

Ser Lys Gly Asn Pro Trp Pro Arg Trp Thr Gly Val Met His Gly Asp 
50 55 60 

Glu lie Asn Tyr Val Phe Gly Glu Pro Leu Asn Pro Ser Leu Gly Tyr 
65 70 75 80 

Thr Glu Asp Glu Lys Asp Phe Ser Arg Lys lie 
85 90 



<210> 15 
<211> 91 
<212> PRT 

<213> Anopheles arabiensis 
<400> 15 

Thr Glu Pro Asp Asn Pro Asn Ser Asn Arg Asp Ala Leu Asp Lys Met 
15 10 15 

Val Gly Asp Tyr His Phe Thr Cys Asn Val Asn Glu Phe Ala Gin Arg 
20 25 30 

Tyr Ala Glu Glu Gly Asn Asn Val Tyr Met Tyr Leu Tyr Thr His Arg 
35 40 45 

Ser Lys Gly Asn Pro Trp Pro Arg Trp Thr Gly Val Met His Gly Asp 
50 55 60 

Glu lie Asn Tyr Val Phe Gly Glu Pro Leu Asn Pro Thr Leu Gly Tyr 
65 70 75 80 

Thr Glu Asp Glu Lys Asp Phe Ser Arg Lys lie 
85 90 



<210> 16 
<211> 91 
<212> PRT 

<213> Anopheles funestus 



21 
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<400> 16 

Thr Glu Pro Asp Asn Pro Asn Ser Asn Arg Asp Ala Leu Asp Lys Met 
15 10 15 

Val Gly Asp Tyr His Phe Thr Cys Asn Val Asn Glu Phe Ala Gin Arg 
20 25 30 

Tyr Ala Glu Glu Gly Asn Asn Val Tyr Met Tyr Leu Tyr Thr His Arg 
35 40 45 



Ser Lys Gly Asn Pro Trp Pro Arg Trp Thr Gly Val Met His Gly Asp 
50 55 60 

Glu lie Asn Tyr Val Phe Gly Glu Pro Leu Asn Pro Ser Leu Gly Tyr 
65 70 75 80 



Thr Glu Asp Glu Lys Asp Phe Ser Arg Lys lie 
85 90 



<210> 17 
<211> 91 
<212> PRT 

<213> Anopheles pseudopunctipennis 
<400> 17 

Thr Glu Pro Asp Asn Pro Asn Ser Asn Arg Asp Ala Leu Asp Lys Met 
15 10 15 

Val Gly Asp Tyr His Phe Thr Cys Asn Val Asn Glu Phe Ala Gin Arg 
20 25 30 

Tyr Ala Glu Glu Gly Asn Asn Val Tyr Met Tyr Leu Tyr Thr His Arg 
35 40 45 

Ser Lys Gly Asn Pro Trp Pro Arg Trp Thr Gly Val Met His Gly Asp 
50 55 60 

Glu lie Asn Tyr Val Phe Gly Glu Pro Leu Asn Pro Gly Leu Gly Tyr 
65 70 75 80 

Thr Glu Asp Glu Lys Asp Phe Ser Arg Lys lie 
85 90 



<210> 13 
<211> 91 
<212> PRT 
<213> Anopheles 



sacharovi 



<400> 18 

Thr Glu Pro Asp Asn Pro Asn Ser 
1 5 

Val Gly Asp Tyr His Phe Thr Cys 
20 



Asn Arg Asp Ala Leu Asp Lys Met 
10 15 

Asn Val Asn Glu Phe Ala Gin Arg 
25 30 




Tyr Ala Glu Glu Gly Asn Asn Val 
35 4 0 

Ser Lys Gly Asn Pro Trp Pro Arg 
50 55 

Glu lie Asn Tyr Val Phe Gly Glu 
65 70 

Thr Asp Asp Glu Lys Asp Phe Ser 
85 




Tyr Met Tyr Leu Tyr Thr His Arg 
45 

Trp Thr Gly Val Met His Gly Asp 
60 

Pro Leu Asn Pro Ser Leu Gly Tyr 
75 80 

Arg Lys lie 
90 



<210> 19 
<211> 91 
<212> PRT 

<213> Anopheles Stephens! 
<400> 19 

Thr Glu Pro Asp Asn Pro Asn Ser Asn Arg Asp Ala Leu Asp Lys Met 
1,5 V> 15 

Val Gly Asp Tyr His Phe Thr Cys Asn Val Asn Glu Phe Ala Gin Arg 
20 25 30 

Tyr Ala Glu Glu Gly Asn Asn Val Tyr Met Tyr Leu Tyr Thr His Arg 
35 40 45 

Ser Lys Gly Asn Pro Trp Pro Arg Trp Thr Gly Val Met His Gly Asp 
50 ' 55 60 

Glu lie Asn Tyr Val Phe Gly Glu Pro Leu Asn Pro Ser Leu Gly Tyr 
65 70 75 80 

Thr Asp Asp Glu Lys Asp Phe Ser Arg Lys lie 
85 90 



<210> 20 
<211> 91 
<212> PRT 

<213> Anopheles albimanus 
<400> 20 

Thr Glu Pro Asp Asn Pro Asn Ser Asn Arg Asp Ala Leu Asp Lys Met 
15 10 15 

Val Gly Asp Tyr His Phe Thr Cys Asn Val Asn Glu Phe Ala Gin Arg 
20 25 30 

Tyr Ala Glu Glu Gly Asn Asn Val Tyr Met Tyr Leu Tyr Thr His Arg 
35 40 45 

Ser Lys Gly Asn Pro Trp Pro Arg Trp Thr Gly Val Met His Gly Asp 
50 55 .60 




23 1 

Glu lie Asn Tyr Val Phe Gly Glu Pro Leu Asn Pro Thr Leu Gly Tyr 
65 70 75 80 

Thr Asp Asp Glu Lys Gly Phe Ser Arg Lys He 
85 90 



<210> 21 



<211> 91 
<212> PRT 

<213> Anopheles nili 
<400> 21 

Thr Glu Pro Asp Asn Pro Asn Ser Asn Arg Asp Ala Leu Asp Lys Met 
1 5 io — 



15 



Val Gly Asp Tyr His Phe Thr Cys Asn Val Asn Glu Phe Ala Gin Arg 
20 25 30 

Tyr Ala Glu Glu Gly Asn Asn Val Tyr Met Tyr Leu Tyr Thr His Arg 
35 40 , 45 

Ser Lys Gly Asn Pro Trp Pro Arg Trp Thr Gly Val Met His Gly Asp 
50 55 60 

Glu He Asn Tyr Val Phe Gly Glu Pro Leu Asn Pro Ser Leu Gly Tyr 
65 70 75 ^ 80 

Thr Glu Asp Glu Lys Asp Phe Ser Arg Lys Met 
85 90 



<210> 22 
<211> 4209 
<212> ADN 

<213> Anopheles gambiae 
<400> 22 

tggtaattac aattcccaag tttgcgtatg 
aaccaataga gtataattac taaggcgggc 
aagcaaaaca aaaagaacaa ttccgttcac 
accttttcat cgatgaccct gtactgacat 
tgcaccctac gcactcaatg caacacacgc 
acgagcacct acttgcactc aagccggcac 
agcactcaca aggaagcaca catttgcaaa 
cagcacagca ttgaacaggt tcgcgccttt 
gttcgaaagt tgaaaagcgc attttttcat 
atccctctct cgtcgtgttt tttctaaaca 
aagaaccaga acgcagcgtg cgtgcggtgc 
acggctgcga gaagcaagat cggagaacag 
ttttgtacta gaacagaaaa cgagacagca 
aggctcacac cgacttttaa ccgaaacatg 
gagtgctcgc gctgatacta agttaatatg 
tcccgacatc atcgctccag gctccagacc 
accgaccact actcacacag cattatcact 



acaatgttaa atgttaagac gctcaaatgc 60 
agtagaaacc aaaatatctt aaataatgtc 120 
tgctcaaaga aagccctaac taactaccta 180 
ggtaagatat tctttatcct ttaactcttc 240 
actactatta ctgctactac tctcgcactc 300 
tcaatgtact agcgaaacac gtcgcatcta 360 
tagcacctac cggaacagct ttgaatgtgc 420 
actcctgtgc tctgttttct cgatcggaat 480 
ctctcttttt ctattcttct tcgtattttt 540 
ttaccatact tcttccgcta cgaactcgcc 600 
ttgcggtgtg tgtgtgtgtg tgtgtattcc 660 
gcatcattcc cctttcacag acaattgcac 720 
taatttccaa cagcctcatt cactcatacc 780 
tactacagaa acaaaaacaa acaatatgga 840 
aagagattac tggcgaggtc atcgatccca 900 
taccaagtcg cctaccatta cctacccacc 960 
tccgccgccg tcgccgccgc cgccgacgcc 1020 



• 



24 



gccgacgcca ccaccttcac accgccctgc caaaatgaat gcgcattgtt gcgatagatt 1080 
gaatttcctt ggttgttgtt gttgttggtt ttcttttgac atgtttgtgt gttgtttttt 1140 
ctttctctct ctctctttct gtggttccaa catttcagac gcatttttta caccatatat 1200 
aggtcacggt gagtccgtac gaattataga tgccgagttg ggcacgctcg agcatgtcca 1260 
cagtggagca acgccgcggc gacgcggcct gacgaggcgc gagtcaaact cgggtaagta 1320 
cgcgattgga agtgggggga cgtttaccct accgtgtact actacaacgc actttacccc 1380 
cacgcacacg caccggcaga cgcgaacgac aacgatccgc tggtggtcaa cacggataag 14 4 0 
gggcgcatcc gcggcattac ggtcgatgcg cccagcggca agaaggtgga cgtgtggctc 1500 
ggcattccct acgcccagcc gccggtcggg ccgctacggt tccgtcatcc gcggccggcc 1560 
gaaaagtgga ccggcgtgct gaacacgacc acaccgccca acagctgcgt gcagatcgtg 1620 
gacaccgtgt tcggcgactt cccgggcgcg accatgtgga acccgaacac gcccctgtcc 1680 
gaggactgtc tgtacattaa cgtggtggca ccgcgacccc ggcccaagaa tgcggccgtc 1740 
atgctgtgga tcttcggcgg cggcttctac tccggcaccg ccaccctgga cgtgtacgac 1800 
caccgggcgc ttgcgtcgga ggagaacgtg atcgtggtgt cgctgcagta ccgcgtggcc 1860 
agtctgggct tcctgtttct cggcaccccg gaagcgccgg gcaatgcggg actgttcgat 1920 
cagaaccttg cgctacggta ggtgtctttg catgtgtgaa tgagggtata gtattctaac 1980 
gaggtgctct tcttcccatc acttcttggg agtcagctgg gtgcgggaca acattcaccg 2040 
gttcggtggc gatccgtcgc gtgtgacact gttcggcgag agtgccggtg ccgtctcggt 2100 
gtcgctgcat ctgctgtccg ccctttcccg cgatctgttc cagcgggcca tcctgcagag 2160 
cggctcgccg acggcaccgt gggcattggt atcgcgcgag gaagccacac taaggtacgt 2220 
gccagctgct gctttcccca aaccaccaac ccgcaacagc tcacacaacc ctcttttccg 2280 
tcgctctttt ctcgctccag agcactgcgg ttggccgagg cggtcggctg cccgcacgaa 2340 
ccgagcaagc tgagcgatgc ggtcgagtgc ctgcgcggca aggacccgca cgtgctggtc 2400 
aacaacgagt ggggcacgct cggcatttgc gagttcccgt tcgtgccggt ggtcgacggt 24 60 
gcgttcctgg acgagacgcc gcagcgttcg ctcgccagcg ggcgcttcaa gaagacggag 2520 
atcctcaccg gcagcaacac ggaggagggc tactacttca tcatctacta cctgaccgag 2580 
ctgctgcgca aggaggaggg cgtgaccgtg acgcgcgagg agttcctgca ggcggtgcgc 2640 
gagctcaacc cgtacgtgaa cggggcggcc cggcaggcga tcgtgttcga gtacaccgac 2700 
tggaccgagc cggacaaccc gaacagcaac cgggacgcgc tggacaagat ggtgggcgac 27 60 
tatcacttca cctgcaacgt gaacgagttc gcgcagcggt acgccgagga gggcaacaac 2820 
gtctacatgt atctgtacac gcaccgcagc aaaggcaacc cgtggccgcg ctggacgggc 2880 
gtgatgcacg gcgacgagat caactacgtg ttcggcgaac cgctcaaccc caccctcggc 2940 
tacaccgagg acgagaaaga ctttagccgg aagatcatgc gatactggtc caactttgcc 3000 
aaaaccgggt aagtgtgtgt gtcaaacagc agagtgtcga tcgctctaac accagcgtct 3060 
tctctcttct acagcaatcc aaatcccaac acggccagca gcgaattccc cgagtggccc 3120 
aagcacaccg cccacggacg gcactatctg gagctgggcc tcaacacgtc cttcgtcggt 3180 
cggggcccac ggttgaggca gtgtgccttc tggaagaagt accttcccca gctagttgca 3240 
gctacctgta agtctcgtgc agcacttgaa accccctccc acatccccat cagggtccag 3300 
gttgcaataa taaatttcac tttctctctc tcacgtctct tttccccaaa acagcgaacc 3360 
taccagggcc agcaccgcct agtgaaccgt gcgaaagcag cgcatttttt taccgacctg 3420 
atctgatcgt gctgctggtg tcgctgctta cggcgaccgt cagattcata caataattac 34 80 
taccccatcc atggcctagt tcgtttaagc tttaagatag tgaggaacaa atttttccca 354 0 
aacaattttc ccccctttag agcagaaccg agggagagat aggactacat agcgaaaagg 3600 
gaaaacaagt ggtggcggac gaggagagaa gaagcaaatc gaataatcga agcaacaaca 3660 
acaacaacaa aaaaactgca accgggttca ctaaacccag ggggcagctc agtagcaaac 3720 
tactacttaa ataactactt tcttatggca aattatggca agagcagtcg tgatgggttc 3780 
gatcagtatc catctgaccg gagcagctga accgtttcat gggcagttgc tgcaatacac 3840 
cacgacccgt acacacagta acacactttt tatagcttta cactaacaac cactctcccc 3900 
acgctcctct tccccttccc ctccacacag acagcagcgc cgtttgtagc aggatctact 3960 
accgtgcggt ttggtatggc ggccaacaac actaaacacc acacatctac taaaacacac 4 020 
cggaacaata aacaaatgtt aaacttacta tatgaatata catctagacg catatatacg 4080 
catgaactac tacttcccct cgtggtctga caaaaacaca ttaccttgtc cccccttccc 4140 
cctccgggtt gcttaccacc actgaccccc agtatgaatt tgttccataa taacgcttcg 4 200 
taactcgct ~ 4209 



<210> 23 
<211> 2557 



25 

<212> ADN 

<213> Anopheles gambiae souche KISUMU 
<400> 23 

aatgaatgcg cattgttgcg atagattgaa tttccttggt tgttgttgtt gttggttttc 60 
ttttgacatg tttgtgtgtt gttttttctt tctctctctc tctctctgtg gttccaacat 120 
ttcagacgca ttttttacac catatatagg tcacggtgag tccgtacgaa ttatagatgc 180 
cgagttgggc acgctcgagc atgtccacag tggagcaacg ccgcggcgac gcggtctgac 240 
gaggcgcgag tccaactcgg gtaagtacgc gattggaagt ggggggacgt ttaccctgcc 300 
— g.tgtactaca^^cac4>t^:a^€c<3ccacgca-ca-cg cdCL;gy cdya^ gc^a~cgacaacgaF~ 3W 
ccgctggtgg tcaacacgga taaggggcgc atccgcggca ttacggtcga tgcgcccagc 420 
ggcaagaagg tggacgtgtg gctcggcatt ccctacgccc agccgccggt cgggccgtta 480 
cggttccgtc atccgcggcc ggccgaaaag tggaccggcg tgctgaacap gaccacaccg 54 0 
cccaacagct gcgtgcagat cgtggacacc gtgttcggcg acttcccggg cgcgaccatg 600 
tggaacccga acacgcccct gtccgaggac tgtctgtaca ttaacgtggt ggcaccgcga 660 
ccccggccca agaatgcggc cgtcatgctg tggatcttcg gcggcggctt ctactccggc 720 
accgccaccc tggacgtgta cgaccaccgg gcgcttgcgt cggaggagaa cgtgatcgtg 780 
gtgtcgctgc agtaccgcgt ggccagtctg ggcttcctgt ttctcggcac cccggaagcg 84 0 
ccgggcaatg cgggactgtt cgatcagaac cttgcgctac ggtaggtgtc tttgcatggg 900 
tgaatgaggg tatagtattc taacgaggtg ctcttcttcc catcacttct tgggagtcag 960 
ctgggtgcgg gacaacattc accggttcgg tggtgatccg tcgcgtgtga cactgttcgg 1020 
cgagagtgcc ggtgccgtct cggtgtcgct gcatctgctg tccgccctgt cccgcgatct 1080 
gttccagcgg gccatcctgc agagcggctc gccgacggca ccgtgggcat tggtatcgcg 1140 
cgaggaagcc acgctaaggt acgtgccagc tgctgctttc cccaaaccac caacccgcga 1200 
cagctcacac aaccctcttt tccttcgctc ttttctcgct ccagagcact gcggttggcc 1260 
gaggcggtcg gctgcccgca cgaaccgagc aagctgagcg atgcggtcga gtgtctgcgc 1320 
ggcaaggatc cgcacgtgct ggtcaacaac gagtggggca cgctcggcat ttgcgagttc 1380 
ccgttcgtgc cggtggtcga cggtgcgttc ctggacgaga cgccgcagcg ttcgctcgcc 14 40 
agcgggcgct tcaagaagac ggagatcctc accggcagca acacggagga gggctactac 1500 
ttcatcatct actacctgac cgagctgctg cgcaaggagg agggcgtgac cgtgacgcgc 1560 
gaggagttcc tgcaggcggt gcgcgagctc aacccgtacg tgaacggggc ggcccggcag 1620 
gcgatcgtgt tcgagtacac cgactggacc gagccggaca acccgaacag caaccgggac 1680 
gcgctggaca agatggtggg cgactatcac ttcacctgca acgtgaacga gttcgcgcag 1740 
cggtacgccg aggagggcaa caacgtctac atgtatctgt acacgcaccg cagcaaaggc 1800 
aacccgtggc cgcgctggac gggcgtgatg cacggcgacg agatcaacta cgtgttcggc 1860 
gaaccgctca accccaccct cggctacacc gaggacgaga aagactttag ccggaagatc 1920 
atgcgatact ggtctaactt tgccaaaacc gggtaagtgt gtgtgtgtgt gtgtgtcaaa 1980 
cagcagagtg tcgatcgctc taacgccttc tctcttcaac agcaatccaa atcccaacac 204 0 
ggccagcagc gaattccccg agtggcccaa gcacaccgcc cacggacggc actatctgga 2100 
gctgggcctc aacacgtcct tcgtcggtcg gggcccacgg ttgaggcagt gtgccttctg 2160 
gaagaagtac cttccccagc tagttgcagc tacctgtaag tctcgtgcag cgcttgaaat 2220 
cctctcccgc atcctcaaca gggtccaggt tgcaataaca aatgtatctc tctctctctc 2280 
acgtctcttt tccccaaaac agcgaaccta ccagggccag caccgcccag tgaaccgtgc 234 0 
gaaagcagcg cattttttta ccgacctgat ctgatcgtgc tgctggtgtc gctgcttacg 2400 
gcgaccgtca gattcataca ataattacta ccccatccat ggcctagttc ttttaagctt 2460 
taagatagtg aggaacaaat ttttcctaac caatttccca acccccttta gagcagaacc 2520 
gagggagaga taggactaca tagcgaaaag ggaaaac " * 2557 



<210> 24 
<211> 273 
<212> ADN 

<213> Culex pipiens souche S-LAB 
<400> 24 

attgaaccgg acaacccgaa cagcaaccgt 
cacttcacct gcaacgtgaa cgaattcgcc 
ttcatgtacc tgtacacgca cagaagcaaa 



gacgcgctgg acaagatggt cggggattat 60 
cagcggtacg ccgaggaggg caacaacgtg 120 
ggaaatccct ggccgaggtg gaccggcgtg 180 



r - 

26 

atgcacggcg acgagatcaa ctacgtgttt ggcgaaccgc tgaactcggc cctcggctac 240 
caggacgacg agaaggactt tagccggaaa att 27 3 

<210> 25 
<211> 273 
<212> ADN 

<213> Culex pipiens souche SR 
<400> 25 

atcgaaccgg acaacccgaa cagcaaccgt gacgcgctcg acaagatggt cggggattat 60 
cacttcacct gcaacgtgaa cgagttcgcc cagcggtacg ccgaggaggg caacaatgtg 120 
ttcatgtacc tgtacacgca cagaagcaaa ggaaatccct ggccgaggtg gactggcgtg 180 
atgcacggcg acgagatcaa ctacgtgttt ggcgaaccgc tgaactcggc cctcggctac 240 
caggacgacg agaaggactt tagccggaaa att 27 3 



<210> 26 
<211> 273 
<212> ADN 

<213> Aedes aegypti 



<400> 26 

actgaaccgg aaaatcccaa cagcaatcgg 
cacttcacgt gtaatgtgaa tga'gtttgcc 
tacatgtatc tgtacactca tagaagcaaa 
atgcatggtg acgagatcaa ttatgtgttc 
atggaggatg aaaaagactt cagtaggaag 



gatgcattgg acaaaatggt cggagattat 60 
cagcgatatg cagaagaagg caacaatgtg 120 
ggtaacccct ggccacggtg gaccggtgtg 180 
ggtgagcctc tgaactctga tctggggtac 240 
att 273 



<210> 27 
<211> 273 
<212> ADN 
<213> Aedes 



albopictus 



<400> 27 

actgaaccag agaatcccaa 
catttcacct gcaacgtgaa 
tacatgtatt tgtacactca 
atgcatggtg acgagatcaa 
atggacgatg agaaagattt 



cagcaatcgg gatgcgttgg 
cgagtttgcc cagcgatatg 
cagaagcaaa ggtaaccctt 
ctatgtattc ggtgagccgt 
cagtagaaag ata 



acaaaatggt gggagattat 60 
cggaagaggg caacaacgtg 120 
ggccacggtg gaccggggtg 180 
tgaattccga cctggggtac 2 40 

273 



<210> 28 
<211> 273 
<212> ADN 

<213> Anopheles darlingi 
<400> 28 

acagaaccgg acaacccgaa cagtaaccgg 
cacttcacgt gtaacgtcaa tgagtttgcg 
tacatgtatc tgtacacgca ccgtagcaaa 
atgcatggtg atgagattaa ctacgtgttc 
accgacgatg agaagggttt cagccggaag 



gacgcgctgg acaagatggt cggtgattat 60 
cagcggtacg ccgaggaggg caacaacgtc 120 
ggcaacccgt ggccccgctg gaccggggtg 180 
ggtgaaccgc tcaacccgac gctcggttac 240 
att 273 



<210> 29 
<211> 273 



27 



<212> ADN 

<213> Anopheles sundaicus 



<400> 29 

accgagccgg acaacccgaa cagcaaccga gacgcgctgg acaagatggt cggcgactat 60 

cacttcacct gcaacgtcaa cgagttcgcc cagcggtacg ccgaggaggg caacaacgtc 120 

tacatgtatc tgtacacgca ccgaagcaaa ggcaacccgt ggccacgctg gacgggtgtg 180 

atgcacggtg acgagattaa ttacgtgttt ggagagccgc ttaaccccac gctcggatac 240 
accgaggacg agaaggactt tagccggaag ate 273 



<210> 30 
<211> 273 
<212> ADN 

<213> Anopheles minimus 



<400> 30 

accgaaccag ataatccgaa cagcaaccgg 
catttcacct gtaacgtgaa egagttcgea 
tacatgtacc tgtacacgca ccgaagcaaa 
atgcacggtg acgagattaa ctacgtgttc 
accgaagacg agaaagactt tagccggaag 



<210> 31 
<211> 273 
<212> ADN 

<213> Anopheles moucheti 



gaegcactgg acaagatggt gggegactae 60 
cagcggtacg ccgaggaggg caacaatgta 120 
ggcaacccgt ggccacgctg gaeeggegtt 180 
ggggaacege tcaacccaag cctcggctac 24 0 



<400> 31 

accgaaccag ataatccgaa cagcaaccgg 
catttcacct gtaacgtgaa egagttcgea 
tacatgtacc tgtacacgca ccgaagcaaa 
atgcacggtg acgagattaa ctacgtgttc 
accgaagacg agaaagactt tagccggaag 



gaegcactgg acaagatggt gggegactae 60 
cagcggtacg ccgaggaggg caacaatgta 120 
ggcaacccgt ggccacgctg gaeeggegtt 180 
ggggaacege tcaacccaag cctcggctac 24 0 



<210> 32 
<211> 273 
<212> ADN 

<213> Anopheles arabiensis 
<400> 32 

accgagccgg acaacccgaa cagcaaccgg 
cacttcacct gcaacgtgaa cgagttcgcg 
tacatgtatc tgtacacgca ccgcagcaaa 
atgcacggcg acgagatcaa ctacgtgttc 
accgaggacg agaaagactt tagccggaag 



gacgcgttgg acaagatggt gggegactat 60 
cagcggtacg ccgaggaggg caacaacgtc 120 
ggcaacccgt ggccgcgctg gaegggegtg 180 
ggcgaaccgc tcaaccccac cctcggctac 240 



<210> 33 
<211> 273 
<212> ADN 

<213> Anopheles funestus 
<400> 33 



SSJ^ 9 ? acaaccc ^ aa cagcaaccgt gacgcgctcg acaaaatggt gggegactat 60 
catttcacct gcaacgtgaa cgagttcgcc cagcggtacg ccgaggaggg ^aacaatg^a 120 




tacatgtacc tgtacacgca ccgaagcaaa ggcaacccat ggccacgctg gacgggcgtt 180 
aUgcacggtg atgagattaa ctatgtgttc ggggaaccgc tcaatcccag cctcggctac 240 
accgaggacg agaaagactt tagccggaag ate 273 



<210> 34 
<211> 273 
<212> ADN 

<213> Anopheles pseudopunctipennis 
<400> 34 

accgagccgg acaacccgaa cagcaaccgg gaegegctgg acaagatggt giggegactae 60 
cacttcacgt gcaacgtgaa cgagttcgcc cagcgctacg ccgaagaggg caacaaegtg 120 
tacatgtatc tgtacacgca ccgaagcaaa ggcaacccgt ggccgcgctg gaccggcgtc 180 
atgcatgggg acgagattaa ctacgtgttt ggggaaccgc ttaacccggg geteggctat 240 
accgaggacg agaaggactt tagcegcaag ate 273 



<210> 35 
<211> 273 
<212> ADN 

<213> Anopheles sacharovi 
<400> 35 

accgagccgg acaacccgaa cagcaaccgg 
cacttcacct gcaacgtgaa cgagttcgcg 
tacatgtacc tgtacacgca caggagcaaa 
atgcatggcg acgagatcaa ctacgtgttc 
accgatgacg agaaagactt tagccggaag 



gaegegctgg acaagatggt eggtgactae 60 
cageggtacg ccgaggaggg caacaacgtc 120 
ggcaacccat ggccgcgctg gaccggcgtc 180 
ggcgaaccgc tcaatcccag cctaggctac 24 0 
att 273 



<210> 36 
<211> 273 
<212> ADN 

<213> Anopheles stephensi 
<400> 36 

accgaaccgg acaatccgaa cagcaaccgg 
catttcacgt gcaacgtgaa egagttcgea 
tacatgtatc tgtacacgca ccgaagcaaa 
atgcatgggg acgaaattaa ctacgtgttc 
accgacgacg agaaagactt tagccggaag 



gatgeattgg acaaaatggt gggegattae 60 
cagegatacg ccgaggaggg caacaatgtg 120 
ggcaatccgt ggccacgctg gaeeggegtt 180 
ggggaaccgc tcaaccctag ccttggttac 240 
ate 273 



<210> 37 
<211> 273 
<212> ADN 

<213> Anopheles albimanus 
<400> 37 

aeggagcegg acaatccgaa cagcaaccgg 
cactttacgt geaaegtcaa cgagttcgcg 
tacatgtatc tgtatacgea ccgcagcaaa 
atgcatggcg atgagatcaa ctacgtgttt 
accgacgacg agaagggctt cagceggaag 



gaegcactgg acaagatggt eggegattat 60 
cageggtacg ccgaggaggg caacaacgtc 120 
ggcaatccgt ggccccgttg gaegggegtg 180 
ggtgaaccgc tgaacccgac gctcggctac 240 
ate 273 



<210> 38 




29 

<211> 273 
<212> ADN 

<213> Anopheles nili 
<400> 38 

accgagccgg ataacccgaa cagcaaccgg gacgcgttag acaagatggt gggcgactac 60 
cacttcacgt gcaacgtgaa cgagttcgcc cagcggtacg ccgaggaggg caacaacgtc 120 
tacatgtacc tctacacgca ccggagcaaa ggcaatccct ggccgcgttg gacgggcgtc 180 
atgcacggtg acgagatcaa ctacgtgttc ggggaaccgc ttaacccgag cc tcgg c tac 24 0 
3x^aggacg^^a.a^ga-et-t--C d L) uuL|Cddy a 'fg " 273 



<210> 39 
<211> 24 
<212> ADN 

<213> Sequence artif icielle 
<400> 39 

atmgwgttyg agtacacsga ytgg 24 



<210> 40 
<211> 24 
<212> ADN 

<213> Sequence artif icielle 
<400> 40 

ggcaaarttk gwccagtatc kcat 24 

<210> 41 
<211> 20 
<212> ADN 

<213> Sequence artif icielle 



<220> 

<223> Description de la sequence artif icielle : amorce 
<400> 41 

ggygckacma tgtggaaycc 



<210> 42 
<211> 24 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : amorce 
<400> 42 

accamratca cgttytcytc cgac 04 



<210> 43 
<211> 23 
<212> ADN 

<213> Sequence artificielle 



I CI 
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<220> . 

<223> Description de la sequence artif icielle : amorce 

<400> 43 

tacatcaacg tggtcgtgcc acg 



<210> 44 
<211> 19 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artif icielle : amorce 
<400> 44 

gtcacggttg ctgttcggg 



<210> 45 
<211> 16 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artif icielle: amorce 
<400> 45 

cgacgccacc ttcaca 



<210> 46 
<211> 20 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artif icielle: amorce 
<400> 46 

gatggcccgc tggaacagat 



<210> 47 
<211> 20 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artif icielle : amorce 
<400> 47 

gggtgcggga caacattcac 



<210> 48 
<211> 17 



<212> ADN 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artif icielle : amorce 
<400> 48 

ccccgaccga cgaagga 



<210> 49 
<211> 20 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artif icielle: amorce 
<400> 49 

agatggtggg cgactatcac 



<210> 50 
<211> 20 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: amorce 
<400> 50 

ctcgtccgcc accacttgtt 20 



<210> 51 
<211> 585 
<212> PRT 

<213> Ciona intestinalis 



<400> 51 

Leu Pro Arg Tyr Gly Ser Val Arg Gly Lys His Val Glu Ser Pro Pro 
15 10 15 

Arg His Gin Arg He Ala Ala Phe Leu Gly He Pro Phe Ala Ser Pro 
20 25 30 

Pro Val Gly Glu Leu Arg Phe Ala Ala Pro Gin Pro Pro Leu Ser Trp 
35 40 45 

Glu Pro Asp Val Arg Gin Thr Thr Glu Phe Gly Asn Ser Cys Val Gin 
50 55 60 

lie Asp Asp Glu Val Phe Gly Asn Phe Arg Glu Met Trp Asn Ala Pro 
65 70 75 80 

Asn Leu Lys Ser Glu Asp Cys Leu Tyr Leu Asn He Trp Thr Pro Arg 
85 90 95 



# 
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He Pro Thr Ser Thr Arg Ser Gin Pro Leu Ala Val Met Val Trp He 
100 105 HO 

Tyr Gly Gly Ser Phe Tyr Ser Gly Thr Thr Ala Leu Ala Leu Tyr Asp 
115 120 125 

Gly Arg Tyr Leu Ala Ala Gin Gly Gly Val Val Val Val Ser He Asn 
130 135 • 140 

Tvr Arg Leu Gly Pro Leu Gly Phe Leu Ala Pro Leu Ala Gly Thr Pro 
145 150 * 155 160 

Gly Asn Ala Gly Leu Leu Asp Gin Gin Leu Ala Leu Lys Trp Val Arg 
165 170 175 

Asp Asn He Arg Ala Phe Gly Gly Asn Pro Asp Asn Val Thr Leu Met 
180 185 190 

Gly Glu Ser Ala Gly Ala Ala Ser He Gly Leu His Thr Val Ala Pro 
195 200 205 

Ser Ser Arg Gly Leu Phe Asn Arg Val He Phe Gin Ser Gly Asn Gin 
210 " 215 , 220 

Met Thr Pro Trp Ser Thr lie Ser Leu Pro Thr Ser Leu Asn Arg Thr 
225 230 235 240 

Arg He Leu Ala Ala Asn Leu Arg Cys Pro Asn Pro Arg Thr Ser Ser 
245 250 255 

Glu Leu Asp Val Leu Thr Cys Leu Arg Ser His Ser Ala Val Asp Val 
260 265 270 

Phe Ser Asn Ser Trp He Thr Gin Glu He Phe Asp Phe Pro Phe Val 
275 280 285 

Pro Val His Gly Thr Ser Phe Leu Pro Glu His Pro His Glu Val Thr 
290 295 300 

Arg Lys Gly Glu Gin Ala Asp Val Asp Val Met Ala Gly His Asn Thr 
305 310 315 320 

Asn Glu Gly Ser Tyr Phe Thr Leu Tyr Thr Val Pro Gly Phe Asn He 
325 330 335 

Ser Ser Gin Ser He Leu Ser Lys Lys Glu Tyr He Asp Gly He Ala 
340 345 350 

Leu Ser Gly He Lys Thr Asn Glu Leu Gly Arg Ser Gly Ala Ala Phe 
355 ' 360 365 

Met Tyr Ala Asp Trp Glu Asn Pro Asp Asn Val Leu Gin Tyr Arg Asp 
370 375 380 

Gly Val Asn Glu He Val Gly Asp Phe His Val Val Cys Pro Thr Val 
385 390 395 400 



33 



f 



Leu Leu Thr Lys Arg His Ser Arg Thr Phe Ser Asn Asn Asn Val Tyr 
405 410 415 

Leu Tyr His Leu Ser Tyr Arg Leu Ser Asn Asn Pro Trp Pro Ala Trp 
420 425 430 

Met Gly Val Met His Gly Tyr Glu He Glu Leu Met Phe Gly Thr Pro 
435 440 445 



_ Jirp _Ehe_Gl-y— T-hr— Se r-Gi-n-Phe- ThTr-S^r^Iy-Tyr-HSn Asp V al ~A~p Arq 
450 455 460 

Ser Val Ser Arg Arg Met Val His Tyr Trp Thr Asn Phe Ala Lys Phe 
465 470 475 480 

Gly Asn Pro Asn Gly Leu Arg Ser Ala Asn Glu Leu Asp Leu Arg Ser 
485 490 495 

Thr Asp Trp Pro Arg Phe Asp Asp Val Arg Gin Arg Tyr Leu Glu He 
500 505 510 

Gly He Asp Asp Asp Val Met Gly Pro Phe Pro Asn Ser Phe Arg Cys 
515 520 , 525 

Ala Phe Trp Glu Arg Tyr Leu Pro Ser Leu Lys Leu Ala Ser Ser Ala 
530 535 540 

Asp Met Asp Glu Val Glu Thr Lys Trp Lys He Glu Phe Asn Arg Trp 
545 550 555 560 

Thr Glu Ser Met Asp Leu Trp Asp Arg Ser Phe Lys Ala Tyr Ser Lys 
565 570 575 

Asp Gly Lys Gin Ser Ser Cys Pro Asn 
580 585 



<210> 52 
<211> 583 
<212> PRT 

<213> Ciona savignyi 
<400> 52 

Gly Ser He Gin Gly Lys His Val Glu Val Thr Ala His Arg Gin Arc 
1 5 io 15 

Tyr Gly Arg Val Ala Thr Phe Gin Gly He Pro Phe Ala Gin Pro Pro 
20 25 30 

Val Gly Glu Leu Arg Phe Ala Ala Pro Gin Pro Pro Leu Ser Trp Glu 
35 40 45 

Pro Asp Val Lys Met Thr Ser Glu Phe Gly Asn Ser Cys lie Gin Glu 
50 55 60 

Asp Asp Leu Val Phe Gly Asn Phe Thr Gly Gly Ser Gin Met Trp Asn 
65 70 75 80 



Ser Pro Asn Ala Lys Ser Glu Asp Cys Leu Tyr Leu Asn Val Trp Thr 
85 90 95 

Pro Val Arg Ser Arg His Ala Glu Pro Leu Ala Val Leu Val Trp He 
100 105 110 

Tyr Gly Gly Ser Tyr Tyr Ser Gly Thr Ser Ser Leu Ala Leu Tyr Asp 
115 ~ 120 125 

Gly Arg Tyr Leu Ala Ala Thr Gly Gly Val Val Val Val Ser Leu Asn 
130 135 140 

Tyr Arg Leu Gly Pro He Gly Phe Leu Ala Pro Leu Ala Asp Glu Thr 
145 " 150 155 160 

Pro Gly Asn Val Gly Leu Leu Asp Gin Gin Leu Ala Leu Lys Trp Val 
165 170 175 

Arg Asp Asn He Arg Glu Phe Gly Gly Asn Pro Asn Asn Val Thr Val 
180 185 190 

Met Gly Glu Ser Ala Gly Ala Ala Ser He Gly Leu His Thr He Ala 
195 200 205 

Pro Ser Ser Arg Gly Leu Phe Ser Arg Val He Leu Gin Ser Gly Asn 
210 215 220 

Gin Met Thr Pro Trp Ser Thr He Ser Leu Glu Thr Ser Leu Asn Arg 
225 230 235 240 

Thr Arg Thr Leu Ala Ala Asn Leu Asn Cys Pro Lys Pro Arg Thr Ala 
245 250 255 

Ser Glu Ala Asp He Leu Ala Cys Leu Arg Thr His Thr Ala Asn Glu 
260 265 270 

Val Phe Ala Gly Ser Trp He Thr Lys Glu He Phe Asp Phe Pro Phe 
275 . 280 285 

Val Pro Val His Gly Thr Thr Phe Leu Pro Glu His Pro His Glu Val 
290 295 300 

Thr Arg Arg Gly Asp Gin Ala Glu Val Asp Val Leu Ala Gly Tyr Asn 
305 310 315 320 

Thr Asn Glu Gly Ser Tyr Phe Thr He Tyr Thr Val Pro Gly Tyr Asn 
325 330 335 

He Thr Thr Asn Ser Val Leu Asn Arg Arg Gin Tyr Leu Ala Gly Val 
340 345 350 

Asp Leu Ser Gly Leu Lys Thr Asn Thr Met Gly Arg Ser Ala Ala Ala 
355 360 365 

Phe Met Tyr Thr Asp Trp Glu Asn Leu Asp Asn Glu Leu Gin Tyr Arg 
370 375 380 



35 



Asp Ala Val Asn Glu lie Val Gly Asp Phe His Val Val Cys Pro Thr 
38 5 390 395 * 400 

Val Leu Val Ser Lys Arg His Ser Asn Ser Phe Pro Asn Arg Asn Val 
405 410 415 

Phe Leu Tyr His Leu Ser Tyr Arg Val Ser Thr Asn Pro Trp Pro He 
420 425 430 

Trp Met Gly Val Met His G lv Tvr G lu Ile_Gl n Leu M<*t- Phg^i^nh^ 
435 440 445 

Pro Trp Phe Gly Asn Ser Lys Phe Thr Arg Gly Tyr Ser Asp Leu Asp 
4 50 4 55 4 60 

Arg Ser Val Ser Arg Arg Met Val Arg Tyr Trp Thr Asn Phe Ala Lys 
465 470 . 475 480 

Phe Gly Asn Pro Asn Gly Leu Arg Asn Gin Asn Gin Glu Leu Val Ser 
485 490 495 

Asp Trp Pro Arg Phe Asn Asp Val Thr Gin Arg Tyr Leu Glu He Ala 
500 505 0 510 

Asp Asp Asp Val Thr Met Ala Pro Phe Pro Asp Ser Phe Arg Cys Ala 
515 520 525 

Phe Trp Gin Lys Tyr Leu Pro Ser Leu Gin Leu Ala Ser Ser Asn Met 
530 535 540 

Asp Glu Val Glu Thr Lys Trp Lys He Glu Phe His Arg Trp Ser Glu 
545 550 555 560 

Ser Met Asp Leu Trp Asp Arg Ser Phe Lys Ala Tyr Ser Ser Asp Asp 
565 570 575 

Lys Gin Asn Ser Cys Pro Asn 



<210> 53 
<211> 645 
<212> PRT 

<213> Anopheles gambiae 
<400> 53 

Met Ala Ser Ala Tyr Tyr His Gin Ser Ala Val Gly Val Gly Asn Val 
1 5 10 is 

Leu Val Leu Leu Leu Gly Ala Thr Val He Cys Pro Ala Tyr Ala lie 
20 25 30 

He Asp Arg Leu Val Val Gin Thr Ser Ser Gly Pro He Arg Gly Arg 



580 



35 



40 



45 



Ser Thr Met Val Gin Gly Arg Glu Val His Val Phe Asn Gly Val Pro 
50 55 60 
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Phe Ala Lys Pro Pro Val Asp Ser Leu Arg Phe Lys Lys Pro Val Pro 
65 70 75 80 

Ala Glu Pro Trp His Gly Val Leu Asp Ala Thr Arg Leu Pro Pro Ser 
85 90 95 

Cys lie Gin Glu Arg Tyr Glu Tyr Phe Pro Gly Phe Ala Gly Glu Glu 
100 105 110 

Met Trp Asn Pro Asn Thr Asn Val Ser Glu Asp Cys Leu Tyr Leu Asn 
115 120 125 

lie Trp Val Pro Thr Lys Thr Arg Leu Arg His Gly Arg Gly Leu Asn 
130 135 140 

Phe Gly Ser Asn Asp Tyr Phe Gin Asp Asp Asp Asp Phe Gin Arg Gin 
145 " 150 155 160 

His Gin Ser Lys Gly Gly Leu Ala Met Leu Val Trp lie Tyr Gly Gly 
165 170 175 

Gly Phe Met Ser Gly Thr Ser Thr Leu Asp lie Tyr Asn Ala Glu lie 
180 185 190 

Leu Ala Ala Val Gly Asn Val lie Val Ala Ser Met Gin Tyr Arg Val 
195 200 205 

Gly Ala Phe Gly Phe Leu Tyr Leu Ala Pro Tyr He Asn Gly Tyr Glu 
210 215 220 

Glu Asp Ala Pro Gly Asn Met Gly Met Trp Asp Gin Ala Leu Ala- He 
225 230 235 240 

Arg Trp Leu Lys Glu Asn Ala Lys Ala Phe Gly Gly Asp Pro Asp Leu 
245 250 255 

He Thr Leu Phe Gly Glu Ser Ala Gly Gly Ser Ser Val Ser Leu His 
260 265 270 

Leu Leu Ser Pro Val Thr Arg Gly Leu Ser Lys Arg Gly He Leu Gin 
275 280 285 

Ser Gly Thr Leu Asn Ala Pro Trp Ser His Met Thr Ala Glu Lys Ala 
290 295 300 

Leu Gin He Ala Glu Gly Leu He Asp Asp Cys Asn Cys Asn Leu Thr 
305 310 315 320 

Met Leu Lys Glu Ser Pro Ser Thr Val Met Gin Cys Met Arg Asn Val 
325 330 335 

Asp Ala Lys Thr He Ser Val Gin Gin Trp Asn Ser Tyr Ser Gly He 
340 345 350 



Leu Gly Phe Pro Ser Ala Pro Thr He Asp Gly Val Phe Met Thr Ala 
355 360 365 



37 

Asp Pro Met Thr Met Leu Arg Glu Ala Asn Leu Glu Gly He Asp He 
370 375 380 



Leu Val Gly Ser Asn Arg Asp Glu Gly Thr Tyr Phe Leu Leu Tyr Asp 
385 390 395 400 

Phe He Asp Tyr Phe Glu Lys Asp Ala Ala Thr Ser Leu Pro Arg Asp 
405 410 415 

L y s Phe Leu Glu H e Met Asn T h r T1* Ph.* n 0 n_T ye _a +F ,_c ^ - y s±u 
420 425 " 430 



Glu Arg Glu Ala He He Phe Gin Tyr Thr Gly Trp Glu Ser Gly Asn 
435 440 445 

Asp Gly Tyr Gin Asn Gin His Gin Val Gly Arg Ala Val Gly Asp His 
450 455 460 

Phe Phe He Cys Pro Thr Asn Glu Phe Ala Leu Gly Leu Thr Glu Ara 
465 470 475 480 

Gly Ala Ser Val His Tyr Tyr Tyr Phe Thr His Arg Thr Ser Thr Ser 
485 49^ 495 

Leu Trp Gly Glu Trp Met Gly Val Leu His Gly Asp Glu Val Glu Tyr 
500 505 " 510 

He Phe Gly Gin Pro Met Asn Ala Ser Leu Gin Tyr Arg Gin Arg Glu 
515 520 525 

530 ^ ^ Val SSr G1U Phe Ala Arg 



535 



540 



Thr Gly Asn Pro Ala Leu Glu Gly Glu His Trp Pro Leu Tyr Thr Ara 

545 can J 5 



550 



555 



560 



Glu Asn Pro He Tyr Phe He Phe Asn Ala Glu Gly Glu Asp Asp Leu 
565 570 575 

Arg Gly Glu Lys Tyr Gly Arg Gly Pro Met Ala Thr Ser Cys Ala Phe 
580 585 590 

Trp Asn Asp Phe Leu Pro Arg Leu Arg Ala Trp Ser Val Pro Leu Lys 
595 600 * 605 

Asp Pro Cys Lys Leu Asp Asp His Thr Ser He Ala Ser Thr Ala Arg 
610 615 620 

Ala Ala Pro Thr Val Ala Leu Leu He Ala Leu Ser Leu Ala Val Ala 
625 630 635 640 

Arg Leu Val Ala Ala 
645 
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